ШІ 


ЕД 
ССС (GNU Compiler Collection，GNU 编 译 器 套件 ) 是 一 套 由 GNU 开 发 的 程序 设计 语言 编译 工具 ， 是 GNU 工 程 中 最 重要 的 组 成 部 分 。 经 过 近 30 年 的 发 展 ，GCC 不 仅 支持 众多 的 前 端 编 程 语言 ， 还 支持 各 


种 主流 的 处 理 器 平台 和 操作 系统 平台 ， 成 为 公认 的 跨 平台 编译 器 的 事实 标准 ， 也 成 为 编译 器 设计 的 成 功 典范 。 
作为 一 名 GCC 编译 器 的 使 用 者 和 源码 阅读 的 爱好 者 ， 我 一 直 想 写 一 本 关于 GCC 的 技术 书 。 

2002 年 ， 我 开始 在 Linux 系 统 上 进行 一 些 软件 开发 ，GCC 就 是 我 使 用 的 编译 工具 。 我 一 直 对 从 源 代 码 到 目标 代码 的 转换 过 程 充满 好 奇 ， 想 知道 在 这 个 过 程 中 GCC 到 底 都 做 了 些 什么 ?” GCC 是 如 何 设计 的 ， 
那些 成 千 上 万 个 GCC 的 源 代码 文件 都 表示 了 什么 意义 ? 那 时 我 常常 幻想 ， 要 是 能 透彻 地 分 析 和 理解 GCC 源 代码 ， 多 好 ! 从 那 时 起 ， 在 教学 科研 之 余 ， 我 偶尔 会 翻阅 一 下 GCC 的 相关 源 代码 ， 可 是 看 着 繁多 的 
GCC 源 代码 ， 也 常常 感觉 手足 无 措 ， 真 有 一 种 “老虎 吃 天 ， 无 法 下 爪 ” 的 走 炊 。 于 是 分 析 GCC 源 代码 的 事情 被 搁置 了 ， 然 而 那 种 一 探究 竟 的 心情 总 是 挥 之 不 去 。 

2012 年 开始 ， 我 有 了 较 多 的 闲暇 时 间 ， 在 经 过 一 段 往复 之 后 ， 分 析 GCC 源 代码 的 冲动 又 一 次 浮现 在 脑海 。 我 知道 ， 这 次 是 要 来 真 的 了 ， 我 要 做 点 自己 喜欢 的 事 。 
清 看 官方 文档 ! 我 也 去 看 了 看 ， 没 错 ，GCC 有 比较 详 





介绍 GCC 的 资料 呀 ? 大 多 人 都 会 说 ， 有 


介绍 给 GCC 的 爱好 者 呢 ? 


介绍 


Why? 
我 有 空余 时 间 了 ， 我 要 干 些 自己 感 兴趣 的 事情 。 在 我 创建 的 GCC 爱 好 者 交流 群 中 经 常 有 朋友 问 ， 有 没有 
细 的 官方 文档 ， 包 括 gccinternal 及 用 户 手 册 等 。 然 而 ， 这 些 文档 的 内 容 庞杂 ， 缺 乏 系统 分 析 GCC 设 计 框 架 和 工作 流程 的 内 容 ， 并 且 大 多 的 内 容 对 读者 来 讲 剖 是 零散 的 ， 让 初学 者 无 所 适 从 。 于 是 我 起， 为 什么 


不 分 析 一 下 GCC 系统 ， 把 GCC 的 设计 实现 用 一 种 更 清晰 明了 、 更 系统 的 方法 


What? 
本 书 将 围绕 GCC 编译 过 程 ， 详 细 介绍 从 源 代码 到 AST、 从 AST 到 GIMPLE、 从 GIMPLE 到 RTL， 以 及 从 RTL 到 最 终 的 目标 机 器 汇编 代码 的 详细 过 程 ， 涉 及 各 个 阶段 中 间 表 示 的 详细 分 析 、 生 成 过 程 。 本 书 
表 和 实例 ， 展 示 了 GCC 编译 系统 的 总 体 工作 流程 和 工作 细节 。 本 书 的 另外 一 个 特点 是 结合 GCC 4.4.0 的 源 代 码 进 行 分 析 ， 使 读者 在 了 解 编译 原理 的 基础 上 进一步 掌握 其 实现 的 总 体 流程 和 细 














提供 了 大 量 的 





图 。 











图 
节 ， 让 更 多 读者 对 编译 技术 的 认识 不 再 只 停留 在 理论 层面 ， 而 是 向 其 展示 一 个 编译 系统 实例 的 实现 过 程 。 


How? 


GCC 源 代码 涉及 的 内 容 非常 庞杂 ， 很 难 在 一 本 书 中 全 面 描述 ， 因 此 本 书 以 GCC 中 间 表 示 为 主线 ， 详 细 分 析 GCC 从 源 代码 开始 ， 直 到 生成 目标 机 器 汇编 代码 的 整个 过 程 中 所 使 用 的 三 种 中 间 表 示 (AST, 
GIMPLE 及 RTL) ， 并 对 这 三 种 中 间 表 示 的 基本 概念 、 生 成 过 程 进行 详细 的 描述 ， 对 基于 GIMPLE 和 RTL 的 优化 处 理 进行 介绍 ， 从 而 描述 一 条 从 源 代码 到 目标 机 器 汇编 代码 的 清晰 路 线 


Who? 


本 书 以 热爱 编译 系统 理论 及 其 实现 的 在 校 大 学 生 、 研 究 生 为 主要 读者 对 象 ， 也 可 以 作为 企业 中 研发 编译 系统 以 及 进行 编译 系统 移植 的 研发 工程 师 的 有 益 参 考 。 
在 编写 这 本 书 的 时 候 ， 有 一 种 精神 支撑 着 我 ， 我 相信 “兴趣 ”加 上 “坚持 ”就 是 胜利 ! 分 析 GCC 不 是 一 年 半 载 的 事情 ， 需 要 3 年 、5 年 ， 甚 至 更 长 时 间 ， 不 过 我 可 以 坚持 ， 我 要 用 我 的 坚持 换 来 对 GCC 的 


深入 分 析 ， 让 更 多 的 GCC 爱好 者 熟悉 它 、 接 触 它 、 了 解 它 ， 更 多 地 参与 GCC 的 开发 与 维护 。 
感谢 我 的 爱人 和 孩子 ， 给 了 我 家 的 温暖 和 亲情 。 感 谢 病 祝 上 的 父亲 ， 虽 然 他 不 能 和 我 说 话 ， 但 他 那 一 双 大 手 ， 依 然 经 常 抚 摸 在 我 的 头 上 。 感 谢 年 老 体 弱 的 母亲 ， 感 谢 她 一 直 照 顾 我 的 父亲 ， 让 我 知道 什 


么 是 坚持 ， 什 么 是 不 离 不 弃 ! 感谢 西安 邮电 大 学 GPU 项 目 组 的 各 位 同事 在 本 书 的 写作 中 提出 的 宝贵 建议 。 


本 书 的 写作 得 到 国家 自然 科学 基金 重点 项 目 〈 项 目 编号 : 61136002) 以 及 陕西 省 教育 厅 科 研 计划 项 目 〈 项 目 编号 : 14JK1674) 资助 
鉴于 作者 水 平 有 限 ， 在 分 析 和 写作 本 书 的 过 程 中 也 引入 了 一 些 个 人 观点 ， 因 此 难免 有 一 些 理解 的 偏差 和 错误 ， 敬 请 读者 批评 指正 并 不 吝 赐 教 ， 如 有 意见 和 建议 ， 请 联系 作者 lazy_linux@126.com， 在 此 一 
王 亚 刚 


2016 年 10 月 于 西安 邮电 大 学 





























并 感谢 ! 
第 1 章 ”GCC 概述 
本 章 主 要 对 GCC 的 发 展 过 程 及 GCC 的 特点 进行 简介 ， 并 给 出 了 本 书 的 主要 内 容 简介 。 
11 GCC 的 产生 与 发 展 
软件 ， 其 官方 网 址 为 https://gcc.gnu.org/。GCC 支 持 多 种 前 端的 编程 语言 ， 包 括 C、C++、Java、Ada 和 Fortran 等 ， 
最 广泛 的 编译 系统 之 一 。GCC 遵 循 GNU GPL (GNU Public License) 协议 ， 由 FSF (Free Software Foundation) 发 布 。 GNU 和 

















GCC (GNU Compiler Collection) 是 GNU 工 程 (GNU Project) 中 的 核心 工 


其 编译 生成 的 目标 代码 可 以 在 几乎 所 有 的 处 理 器 平台 上 运行 ， 是 目前 使 








GCC 的 图 标 如 图 1-1 所 示 。 




















а) GNU 图 标 


图 1-1 GNU 及 GCC 的 图 标 








b) GCC BIER 


初期 的 GCC 仅仅 作为 C 语 言 的 编译 器 ， 即 GNU C Compiler, 1987 ЕССС 1.0 发 布 ， 同 年 12 月 ，GCC 开 始 支 持 C+ + 语言 ， 随 后 ，GCC 开 始 支持 Objective-C、Objective-C++、Fortran、Java 和 Ada 等 
语言 。 与 此 同时 ，GCC 也 被 逐渐 移植 到 各 种 各 样 的 主流 处 理 器 体系 结构 上 ， 包 括 i386、ix86_64、SPARCE、ARM 和 MIPS 等 处 理 器 平台 。 














本 ， 其 中 最 重大 的 变化 是 在 1999 匀 











相关 的 资料 可 以 查阅 以 下 官方 网 站 信息 : 

















自从 1987 年 Richard Stallman 和 Len Tower 发 布 GCC 的 第 一 个 版 本 GCC 1.0 以 来 ， 目 前 GCC 的 最 新 版 本 已 经 更 新 到 GCC 6.0，https://gcc.gnu.org/releases.htm| 给 出 
F7 月 ，GCC 与 EGCS (Experimental/Enhanced GNU Compiler System) 重新 融合 并 发 布 了 GCC 2.95 版 本 。 





时 了 GCC 在 各 个 时 期 推出 的 GCC 版 





GNU Compiler Collection: https://gcc.gnu.org/ 
Free Software Foundation: http://www.fsf.org/ 
GNU Project: https://gnu.org/ 
GNU Public License: https://www.gnu.org/licenses/licenses.en.html#GPL 


12 GCC 的 特点 











GCC 作 为 目前 较为 成 功 的 编译 系统 之 一 ， 具 有 非常 突出 的 优点 ， 主 要 包括 : 


(1) GCC 编译 系统 支持 众多 的 前 端 编程 语言 ，GCC 4.4.0 中 $GCC_SOURCE}/gcc/ 目 录 下 包含 了 前 端 编程 语言 处 理 的 目录 及 其 代码 (其 




















包括 C、C++、Ada、Fortran、Java、Objective-C、Objective-C++ 等 语言 的 前 端 处 理 ， 可 以 使 用 如 下 命令 查看 这 些 目录 : 





[GCCQlocalhost 


агихгихг-х. 
агихгихг-х. 
агихгихг-х. 
агихгихг-х. 
агихгихг-х. 
агихгихг-х. 


(2) GCC 支持 众多 的 目标 机 器 体系 结构 ， 具 有 


ммм 


адсс-4.4.015 15 -1 дс 
ссс ссс 69632 Арг 
ссс ссс 4096 Nov 
ссс ССС 4096 Nov 
ссс ссс 4096 Oct 
ссс ссс 4096 Арг 
ссс ССС 4096 Арг 


с 
21 
27 


2009 ада 
2013 ср 


6 15:14 fortran 
9 17:34 java 


21 
21 


2009 оріс 
2009 objcp 











如 ，arm、i386、mips 以 及 alpha 等 ， 以 下 是 GCC 4.4.0 代 码 所 支持 的 处 理 器 列表 : 

















alpha arc arm 

Crx fr30 frv 

іаб4 142000 m32c 

m68k mcore mips 

pa рар11 рісосһір 

всоге Sh врагс 

v850 Vax xtensa 
(3) GCC 和 具有 丰富 的 配套 工具 


GCC 不 是 一 个 孤立 的 编译 工具 ， 而 是 整个 GNU 工 程 中 的 一 个 组 成 部 分 。GNU 工 程 中 的 
Toolchains， 例 如 汇编 工 








可 以 使 用 下 述 的 shell 命 令 查看 GNU 二 进 制 工具 链 中 主要 包括 的 工 




















链 支持 。 


ауг cris 
Һ8300 1386 
m32r m68hc11 
mmix mn10300 
rs6000 5390 

spu stormy16 





























аѕ, 


连接 工 











ld, 







































































中 ，${GCC_SOURCE} 表 示 GCC 源 代码 的 主 目录 ， 下 同 ) ， 3 





良好 的 可 移植 性 ，GCC 4.4.0 的 ${(GCC_SOURCEWMgcc/config/ 目 录 下 包含 了 GCC 对 目标 处 理 器 的 支持 情况 ， 其 中 包括 了 各 种 主流 的 处 理 器 ， 例 








他 软件 ， 包 括 GNU C 库 glibc、GNU 的 调试 工 
标 文件 分 析 工 具 objdump、objcopy 等 ) 等 都 与 GCC 关系 密切 ， 互 相依 赖 。 






























































gdb， 以 及 GNU 二 进 制 工 


链 binutils (GNU Binutils 


шік 2 аі 





[ССС@1оса1һо5© раад-асс15 


-гихг-хг-Х. 
-гихг-хг-Х. 
-гихг-Ххг-Х. 
-гихг-Ххг-Х. 
-гихг-хг-х. 
-кихг-хг-х. 
-Үмхг-хг-х. 
-кихг-хг-х. 
-кихг-хг-х. 
-гихг-хг-Хх. 


1 


1 
1. 
1 
1 
1 
1. 
1 
1 
1 


root 
root 
root 
root 
root 
root 
root 
root 
root 
root 


root 
root 
root 
root 
root 
root 
root 
root 
root 
root 


rpm 
24352 
54444 
527220 

26356 

99212 
588116 

38800 
212216 
276528 
54448 


Осё 
Ое 
Oct 
Oct 
Oct 
Oct 
Oct 
Oct 
pët 
Oct 


15 
15 
15 
15 
15 
15 
15 
15 
15 
15 


-ql binutils | xargs ls -І | grep "/usr/bin" 


2014 /usr/bin/addr2line 
2014 /usr/bin/ar 

2014 /usr/bin/as 

2014 /usr/bin/c++filt 
2014 /usr/bin/gprof 
2014 /usr/bin/ld 

2014 /usr/bin/nm 

2014 /usr/bin/objcopy 
2014 /usr/bin/objdump 
2014 /usr/bin/ranlib 


Herr 


root root 288560 Oct 15 
root root 27196 Oct 15 
root root 25832 Oct 15 
root root 212244 Oct 15 


2014 /usr/bin/readelf 
2014 /usr/bin/size 
2014 /usr/bin/strings 
2014 /usr/bin/strip 





(4) GCC 提供 可 靠 、 高 效 、 高 质量 的 目标 代码 。 



































GCC 是 目前 使 用 的 最 为 广泛 的 编译 器 系统 之 一 ， 众 多 工业 级 应 用 的 实践 证 明 ，GCC 编 译 系统 生成 的 代码 具有 很 高 的 可 靠 性 和 运行 效率 。 








(5) GCC 对 于 并 行 编译 的 支持 。 




















在 GCC 4.4.0 中 ， 已 经 提供 了 对 OpenMP 的 完整 支持 。 


13 GCC 代码 分 析 


GCC 作为 目前 GNU 项 目 中 应 用 最 广泛 的 工 


























软件 之 一 ， 是 工程 师 设 计 编译 系统 最 典型 、 最 成 功 的 范例 ， 是 高 校 学 生 学 习 编译 系统 最 生动 、 最 权威 的 设计 实例 ， 同 时 也 是 程序 员 进 行 高 质量 代码 设计 的 有 








益 参考 。 本 书 以 GCC 4.4.0 的 源 代码 为 例 ， 对 GCC 的 设计 和 实现 进行 分 析 和 解读 ， 主 要 涉及 以 下 内 容 : 





(1) GCC 的 发 展 历史 及 特点 ; 


(2) GCC 的 总 体 结构 ; 





(3) GCC 中 各 种 中 间 表 示 (包括 抽象 语法 树 、GIMPLE、 寡 存 器 传输 语言 ) 的 生成 技术 ; 


(4) GCC 中 基于 GIMPLE 的 优化 处 理 ， 这 一 部 分 主要 实现 一 些 与 目标 机 器 无 关 的 性 能 优化 ; 














(5) GCC 中 基于 RTL 的 优化 处 理 ， 这 一 部 分 主要 实现 一 些 与 目标 机 器 相关 的 性 能 优化 ; 




















(6) GCC 的 移植 技术 ， 即 如 何 让 GCC 支持 新 的 目标 机 器 。 














本 书 将 紧密 围绕 编译 系统 中 的 中 间 表 示 (ІК, Intermediate Representation) 这 一 核心 概念 ， 重 点 介绍 GCC 中 的 三 种 中 间 表 示 : 抽象 语法 树 (AST，Abstract Syntax Tree) 、GIMPLE 和 寄存 器 传输 
语言 (RTL，Register Transfer Language) ， 对 其 基本 概念 、 存 储 结构 及 其 生成 过 程 等 进行 深入 分 析 。 由 于 GCC 基于 GIMPLE 和 RTL 的 优化 处 理 数量 非常 多 ， 每 种 优化 处 理 都 涉及 一 个 比较 独立 的 优化 问 


题 ， 很 难 在 本 书 中 一 一 详 述 ， 
安 邮电 大 学 自主 














Кә 














БШ, FERH 


























地 介绍 了 GCC 中 基于 GIMPLE 及 RTL 的 优化 处 理 的 基本 组 织 方式 ， 并 对 其 中 一 些 非常 典型 的 优化 处 理 进行 了 简介 。 最 后 ， 本 书 也 给 出 了 将 GCC 成 功 移植 到 西 


发 的 阵列 处 理 器 上 的 一 个 实例 。 














限于 篇 幅 ， 书 中 的 大 部 分 代码 只 给 出 了 简化 版 本 ， 读 者 在 分 析 时 需要 结合 源 代码 仔细 研读 。 





第 2 章 ”GCC 源 代码 分 析 工 具 











代码 分 析 是 一 件 烦 琐 的 


GCC 代码 时 ， 通 常 遇 到 的 典型 问题 包括 : 








(1) 如 何 跟 踪 函 数 调 





(2) 如 何 查看 一 个 变量 | 





的 定义 ; 








情 。 在 分 析 GCC 源 代码 时 ， 几 乎 所 有 的 人 都 会 说 : “这 么 多 的 代码 ， 人 怎么 看 ?” ”是 的 ， 面 对 GCC 4.4.0 如 此 庞大 的 代码 量 ， 原 始 的、 徒手 的 做 法 显然 是 不 足以 应 付 的 。 在 阅读 





(3) 如 何 查看 一 个 函数 被 哪些 函数 调用 过 ; 




















(4) 如 何 分 析 函 数 之 间 的 调用 关系 ; 


























(5) 如 何 理解 某 个 函数 的 工作 过 程 。 





当然 ， 除 了 理解 这 些 表面 的 问题 ， 更 深 








作 ， 这 些 阶段 之 间 又 是 如 何 相互 联系 起 来 的 ? 


层 的 问题 就 是 GCC 到 底 是 如 何 设计 的 ?GCC 这 么 庞大 的 代码 是 如 何 组 织 的 ”GCC 在 进行 源 代 码 编译 的 过 程 中 都 包括 哪些 主要 的 处 理 阶段 ， 每 个 阶段 完成 了 哪些 工 




















这 些 问题 的 回答 ， 都 需要 对 GCC 的 代码 进行 详细 分 析 。 笔 者 认为 ， 没 有 好 的 工具 作为 辅助 ， 分 析 GCC 代 码 几乎 是 不 可 能 的 ! 本 章 主 要 介绍 一 些 作者 在 分 析 GCC 4.4.0 代 码 时 所 使 用 的 一 些 常 用 工具 ， 供 


大 家 参考 。 这 部 分 内 容 仅仅 是 点 到 


























为 止 ， 详 细 内 容 请 参阅 其 用 户 文档 。 








本 书 介绍 的 所 有 代码 分 析 工具 均 基 于 Centos Linux 系 统 。 


2.1 vim+ctags 代 码 




















阅读 工具 

































































vim 是 Linux 中 应 用 最 广泛 的 编辑 器 ， 也 是 阅读 GCC 4.4.0 源 代码 的 首选 工具 。ctags 是 一 种 标签 工具 ， 可 以 配合 vim 编 辑 器 ， 帮 助 用 户 很 方便 地 实现 代码 中 的 符号 跟踪 。 








下 面 简单 介绍 使 用 vim+ ctags 对 GCC 4.4.0 源 代码 分 析 的 过 程 。 为 了 描述 方便 ， 全 书 使 用 ${GCC_SOURCE} 来 表示 GCC 4.4.0 代 码 所 在 的 顶 


























(1) 使 用 yum 工 具 安装 ctags 程 序 。 









































i 
5 





[root@localhost ~]# sudo уша install ctags 


























(2) 使 用 wget 工 具 从 GCC 源 代 码 的 镜像 站 点 下 载 GCC 4.4.0 的 源 代码 文件 。 











[GCC@localhost ~]$ wget -c http://mirrorl.babylon.network/gcc/releases/gcc-4.4.0/gcc-4.4.0.tar.bz2 

--2015-05-19 10:06:52-- http://mirrorl.babylon.network/gcc/releases/gcc-4.4.0/gcc-4.4.0.tar.bz2 

Resolving mirror] .babylon.networkhttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ероок/опсотргеѕѕей/16037/0ЕВРЅ/Техі/... 5.135.162.176, 2001:4140:8:е550::1 
Connecting to mirrorl.babylon.network|5.135.162.176| :80http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/16037/0EBPS/Text/... connected. 
НТТР request sent, awaiting responsehttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ероок/опсотргеѕѕей/16037/0ЕВРЅ/Техі/... 200 OK 

Length: 62708198 (60M) [application/octet-stream] = 

Saving бо: “gcc-4.4.0.tar.bz2” 

100% А 1 62,708,198 211К/5 іп 4m 515 

2015-05-19 10:11:45 (210 KB/s) - “gcc-4.4.0.tar.bz2” saved [62708198/62708198] 




















(3) 使 用 tar 工 具 对 源 代 码 进行 解压 。 











[GCC@localhost vim-ctags]$ tar xjvf gcc-4.4.0.tar.bz2 











(4) 进入 gcc-4.4.0 目 录 ， 运 行 ctags， 生 成 tags 文 件 。 

















[GCC@localhost vim-ctags]$ cd gcc-4.4.0 
[GCC@localhost gcc-4.4.0]$ ctags -R 
[GCC@localhost gcc-4.4.0]$ ls -l tags 
-rw-rw-r--. 1 ССС GCC 52296910 Мау 19 10:14 tags 














可 以 看 出 ， 生 成 的 tags 文 件 的 大 小 为 52296910 字 节 ， 包 含 的 tags 信 息 非 常 多 ， 有 兴趣 的 读者 可 以 使 用 文本 工具 打开 该 tags 文 件 ， 查 看 其 中 的 内 容 。 




















(5) 使 用 vim 查 看 GCC 4.4.0 源 代码 。 














在 查看 源 代 码 时 ， 需 要 先 对 代码 的 结构 进行 大 致 了 解 ， 从 合适 的 入 口 开始 分 析 。 一 般 来 讲 ， 按 照 程序 的 执行 流程 来 分 析 代码 的 结构 及 其 运行 过 程 是 一 个 不 错 的 选择 ， 因 此 ， 笔 者 选择 从 
$fGCC_SOURCE}/gcc/main.c 文 件 入 手 ， 使 用 vim 来 查看 该 文件 。 















































这 里 需要 特别 说 明 的 是 ， 执 行 vim 命 令 时 的 当前 工作 目录 应 该 和 tags 文 件 所 在 的 目录 相同 ， 这 样 才能 在 vim 中 使 用 tags 文 件 。 上 面 执行 ctags 命 令 产生 的 tags 文 件 在 ${GCC_SOURCE} 目 录 中 ， 因 此 ， 运 行 
vim 时 ， 当 前 工作 目录 应 该 切换 到 ${GCC_SOURCE) 目 录 中 。 




















[GCC@localhost vim-ctags]$ са асс-4.4.0 
[GCC@localhost асс-4.4.015 vim gcc/main.c 














系统 显示 如 图 2-1 所 示 。 

















显然 ， 在 该 文件 中 ， 读 者 感 兴趣 的 是 main 函 数 中 调用 的 toplev_main 函 数 的 实现 。 此 时 ， 只 需要 将 光标 移动 到 toplev_main 函 数 名 称 上 ， 并 按 Ctrl+] 组 合 键 ， 此 时 vim 会 根据 tags 中 提供 的 信息 ， 自 动 打 
开 函 数 toplev_main 所 在 的 文件 gcc/toplev.c， 并 且 让 光标 停留 在 该 函数 的 开始 ， 如 图 2-2 所 示 。 


























在 分 析 了 toplev_main 函 数 的 实现 过 程 后 ， 如 果 需 要 回 到 main 函 数 处 ， 只 需要 按 Ctrl+O 组 合 键 即 可 。 

















当然 ， 对 于 代码 中 所 有 的 变量 声明 、 类 型 声明 、 函 数 名 称 等 标签 ， 均 可 以 使 用 上 述 方法 快速 查看 其 定义 及 实现 ， 避 免 了 分 析 源 代码 中 繁重 的 搜索 工作 ， 极 大 地 提高 了 代码 阅读 和 分 析 的 效率 。 








GCC@localhost:~/vim-ctags/gcc-4.4.0 
File Edit View Search Terminal Help 


for more details. 


You should have received a copy of the GNU General Public License 
along with GCC; see the file COPYING3. If not see 
<http://www.gnu.org/licenses/>. %/ 


"config.h" 
"system. h" 
"coretypes.h" 
"tm. h" 
#include "toplev.h" 


int main (int argc, char **argv); 


/* We define main() to call toplev main(), which is defined іп toplev.c. 
We do this in a separate file in order to allow the language front-end 
to define a different паіп(), if it so desires. */ 


int 
main (int argc, char **агду) 


{ 


} 
"gcc/main.c" 36L, 1154C 


return topllev main {argc, {const char %%) argv}; 








2-1 使 用 vim 编 辑 查看 文件 











A GCC@localhost:~/vim-ctags/gcc-4.4.0 


File Edit View Search Terminal Help 


} 


timevar_stop {TV TOTAL); 
timevar print {stderr); 


/* Entry point of ccl, ссірін5, јс1, #771, etc. 
Exit code is FATAL EXIT CODE if can't open files or if there were 


any errors, ог SUCCESS EXIT CODE if compilation succeeded. 


It is not safe to call this function more than once. %/ 


int 


1Ёр1еу таіп {unsigned int argc, const char **агду) 


save argv = агам; 


/% Initialization of 6СС"5 environment, and diagnostics. */ 
general_init (агду[@]); 


/* Parse the options and do minimal processing; basically just 
enough to default flags appropriately. %/ 
decode options (argc, агам); 


init local tick (); 


"gcc/toplev.c" [converted] 22341, 62037С 


2-2 vim 中 利用 tags 跳 转 到 函数 实现 


22 GNU gdb 调 试 工具 


























调试 工具 是 代码 分 析 中 至 关 重 要 的 工具 之 一 。 在 使 用 vim+ ctags 查 看 代码 时 ， 经 常会 遇 到 难以 理解 的 部 分 ， 此 时 ， 可 以 借助 调试 工具 ， 对 代码 的 运行 过 程 进行 跟踪 ， 通 过 跟踪 运行 过 程 以 及 关键 数据 的 
变化 ， 可 以 从 程序 执行 的 过 程 中 理解 源 代码 的 功能 。 


调试 工具 有 很 多 种 ， 最 常用 的 是 GNU gdb 工 具 。 下 面 通过 一 个 例子 ， 介 绍 如 何 使 用 gdb， 这 些 调试 命令 几乎 就 是 笔者 调试 程序 的 所 有 命令 ， 简 单 且 实 用 。 


































































































关于 完整 的 gdb 的 使 用 ， 请 参与 GNU дару. 









































档 ， 或 者 使 用 man gdb 进 行 在 线 查询 。 


本 例 主 要 使 


















































首先 ， 可 以 在 程序 入 口 处 设置 断 点 (Break Point) : 














gdb 来 跟踪 GCC 的 运行 过 程 ， 因 此 ， 需 要 事先 编译 GCC 源 代码 (编译 时 需要 使 用 -9 选项 ) ， 生 成 可 执行 的 编译 程序 cc1， 下 面 利用 gdb 对 cc1 程 序 的 运行 进行 跟踪 。 





[СССё1оса1һоѕі paag-gcc]$ дар host-i686-pc-linux-gnu/gcc/ccl 
GNU gdb (GDB) Red Hat Enterprise Linux (7.2-75.е16) 

Copyright (C) 2010 Free Software Foundation, Inc. 

License GPLv3+: GNU GPL version 3 or later <http://gnu.org/licenses/gpl.html> 
This is free software: you are free to change and redistribute it. 

There is NO WARRANTY, to the extent permitted by law. Type "show copying" 
and "show warranty" for details. 

This GDB was configured as "i686-redhat-linux-gnu". 

For bug reporting instructions, please see: 
<http://www.gnu.org/software/gdb/bugs/>http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/16037/0EBPS/Text/... 

Reading Symbols from (bonel баат soo /hont ou bron Lin gao eee mt лсоосае :сопигевоцгое/геаавоок аы /орелкезсигова васт ebook/uncompressed/16037/0EBPS/Text/.. 
(gdb) b main 设置 执行 断 点 


Breakpoint 1 at Oxg0c253d: file http: //wuw .hzcourse. com/resource/readBook?path=/openresources/teach ebook/uncompressed/16037/0EBPS/Text/../http://www.hzcourse.com/resource/reac 
(gdb) info break 查看 断 点 设置 情况 

Num Type Disp Enb Address What 

1 breakpoint keep у 0х080с253а іп main at http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/16037/O0EBPS/Text/../http://www.hzcc 
(gdb) 





执行 程序 ，gdb 执 行 到 断 点 处 会 自动 停止 ， 返回 交互 界面 。 





(gdb) run <- 运行 程序 

Starting program: /home/GCC/paag-gcc/host-i686-pc-linux-gnu/gcc/ccl 
Breakpoint 1, main (argc=1, argv=0xbffff434) at http://www.hzcourse.com/resource/readBook?path=/openresources/teach_ebook/uncompressed/16037/0EBPS/Text/ . ./http://www.hzcourse.c 
35 return toplev_main (argc, (const char **) argv); 

Missing separate debuginfos, use: debuginfo-install 911рс-2.12-1.149.е16.1686 gmp-4.3.1-7.e16 2.2.1686 трЁг-2.4.1-6.е16.1686 





的 调 


|= 






































。 对 于 其 他 代码 ，step 和 next 命 令 的 功能 基本 相同 。 

















此 时 可 以 看 到 ， 使 用 run 命 令 执 行程 序 后 ， 程 序 执行 到 前 面 定义 的 断 点 处 暂停 执行 。 




















Я 


0 果 此 时 需要 查看 toplev_main 函 数 的 执行 细节 ， 应 该 使 用 step 命 令 进入 该 函数 。 








步 跟 踪 程 序 的 执行 ，step 命 令 和 next 命 令 均 可 以 进行 单 步 跟踪 ， 二 者 的 主要 区 别 在 于 step 在 单 步 执行 函数 代码 时 ， 会 进入 被 调用 的 函数 ， 而 next 则 会 将 函数 调用 看 作 “ 单 步 ”， 一 次 执行 完 一 个 函数 





(gdb) step 一 单 步 跟踪 
toplev таіп (argc=1, argv=0xbffff434) at http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/16037/0EBPS/Text/../http://www.hzcourse.com/resc 








对 于 程序 执行 过 程 中 ， 需 要 查看 某 些 变量 的 值 ， 可 以 使 




















print 命 令 。 





(gdb) Print argc < 打印 变量 值 
51-1 
(gdb) print argv[0 - 打印 变量 值 


$2 = Oxbffff5b5 "/һоте/СОСС/раад-асс/һовЕ-1686-рс-1іпих-апа/дсс/сс1" 









































查看 变量 的 值 可 以 使 用 print 命 令 ， 如 果 在 每 一 条 指令 后 都 需要 查看 某 些 变 量 的 值 ， 使 用 print 显 得 有 些 烦琐 ， 可 以 使 用 display 命 令 ， 设置 显示 的 变量 。 





























(gdb) disp argc 一 设置 变量 查看 


1: argc = 1 


(gdb) next 一 单 步 执行 
2215 general init (argv[0]); 


1: argc = 1 
(gdb) next 


2219 decode options (argc, argv); 


1: argc = 1 
(gdb) next 
2221 init local tick (); 
1: argc = 1 





可 以 看 出 ， 每 执行 一 步 ， 变 量 argc 的 值 都 会 输出 显示 。 








当 需 要 连续 执行 程序 时 ， 可 以 使 








continue 命 令 ， 程 序 则 


恢复 运 


Z: 


行 


直到 下 一 个 断 点 处 再 次 暂停 运行 。 
































通常 ， 在 执行 到 某 个 断 点 处 时 ， 当 


需要 了 解 当前 函数 的 调 














情况 时 ， 可 以 使 用 bt 命令 (backtrace) 。 








(gdb) bt 一 显示 函数 调用 的 堆栈 
#0 toplev main (argc=1, argv=0xbffff434) at http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/16037/0EBPS/Text/../http://www.hzcourse.com/r 
#1 main (argc=1, argv=0xbffff434) at http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/16037/O0EBPS/Text/../http://www.hzcourse.com/resource 












































可 以 看 出 当前 执行 的 函数 为 toplev_main 函 数 ， 其 调用 者 为 函数 main， 并 且 这 两 个 函数 所 在 的 文件 及 位 置信 息 也 在 bt 的 输出 中 给 出 。bt 命 令 的 输出 可 以 很 详细 地 展示 当前 函数 的 调用 关系 


序 的 执行 流程 非常 有 帮助 。 


另外 ，gdb 在 输入 命令 时 ， 如 果 输 入 命令 的 开始 部 分 可 以 完全 确定 一 
为 c 等 ， 如 果 用 户 没 有 输入 命令 ， 直 接 按 回 












































使 用 过 程 中 不 断 总 结 ， 提 高 调试 效率 。 

















另外 ， 还 有 其 他 众多 的 调试 工具 ， 





， 对 于 理解 程 


个 命令 时 ， 则 可 以 简写 该 命令 ， 例 如 ， 一 般 用 户 经 常 将 命令 run 简 写 为 r，step 命 令 简写 为 S，next 命 令 简写 为 n，continue 命 令 简 写 


车 键 ， 则 gdb 默 认 会 执行 上 一 次 输入 的 命令 。 例 如 在 单 步 跟踪 时 ， 如 果 输 入 了 命令 next， 后 续 单 步 跟 踪 则 可 以 





== 
只 需 





要 按 [Enter] 键 就 可 以 了 。 这 些 规 得 


+} 


， 读 者 可 以 在 


这 些 工 具 大 都 对 gdb 程 序 进行 了 封装 ， 例 如 cgdb， 可 以 提供 一 些 方便 地 实现 源 代码 查看 等 其 他 很 有 特色 的 功能 ， 其 官网 地 址 为 http://cgdb.sourceforge.net/。 可 以 





通过 以 下 代码 进行 cgdb 程 序 的 安装 。 





root@localhost ~]# wget 
root@localhost cgdb-0.6 
root@localhost cgdb-0.6. 
root@localhost cgdb-0.6. 
root@localhost cgdb-0.6 
6 


[ 
[ 
[ 
i 
[root@localhost cgdb-0.6. 


-c http://prdownloads.sourceforge.net/cgdb/cgdb-0.6.6.tar.gz?download 
.6]# tar xzvf cgdb-0.6.6.tar.gz 

6]# cd cgdb 

6]# yum install readline* 
.6]# ./configure 

6]# make; make install 











例如 ， 可 以 使 用 cgdb 对 cc1 进 行 调试 。 











[GCC6localhost gcc-4.4.0]$ cgdb ~/paag-gcc/host-i686-pc-linux-gnu/gcc/ccl 





界面 如 图 2-3 所 示 ， 可 以 看 到 cgdb 中 能 够 很 方便 地 查看 源 代码 。 关 于 cgdb 的 使 用 请 查阅 相关 文档 ， 不 再 歼 述 。 





=] GCC@localhost:~/vim-ctags/gcc-4.4.0 [ 
File Edit View Search Terminal Help 
int main (int argc, char **агду); 
/* We define паіп() to call toplev таіп(), which is defined іп toplev.c. 
Ме do this in a separate file in order to allow the language front-end 


to define a different таіп(), if it so desires. */ 


int 
main (int argc, char **агду) 


return toplev main (argc, (const char %%) агам); 


/потме/бсс/раад-дсс/дсс/таіп. с 

[?1934h[?1934hGNU gdb {GDB) Кей Hat Enterprise Linux (7.2-75.е16) 

Copyright (С) 2010 Ғгее Software Foundation, Іпс. 

License GPLv3+: GNU GPL version 3 ог later <http://gnu.org/licenses/gpl.html> 
This is free software: you are free to change and redistribute it. 

There is NO WARRANTY, to the extent permitted by law. Type "show copying" 
and "show warranty" for details. 

This GDB was configured as "i686-redhat-linux-gnu". 

For bug reporting instructions, please see: 
<http://www. gnu .org/software/gdb/bugs/>... 

Тень) A symbols from /home/GCC/paag-gcc/host-i686-pc-linux-gnu/gcc/ccl. ..done. 
(996) 





2-3 саа 


23 GNU binutils 工 具 























在 分 析 GCC 代 码 时 ， 尤 其 是 后 端 代码 生成 的 过 程 中 ， 经 常 需要 对 编译 生成 的 目标 文件 进行 分 析 ， 包 括 编译 生成 的 汇编 代码 、 目 标 文件 等 ， 此 上 时， 如果 能 够 熟练 使 用 GNU binutils 工 具 链 中 的 工具 ， 无 疑 






































将 对 分 析 非 常 有 用 。GNU binutils 工 具 的 源 代码 及 介绍 参见 GNU 的 官网 : http://www.gnu.org/software/binutils/， 其 中 主要 工具 如 表 2-1 所 示 。 

















表 2-1 GNU binutils 中 的 主要 工具 


工具 名 称 {Е 用 

ld GNU 链接 全 

as GNU 汇编 名 

ar 归档 文件 (archives) 的 打包 工具 ， 用 来 生成 静态 或 者 动态 链接 库 
ranlib 生成 归档 文件 内 容 的 索引 

nm 显示 目标 文件 中 的 符号 信息 

objdump 显示 目标 文件 信息 ， 可 以 用 目标 文件 的 反 汇 编 等 
objcopy 目标 文件 的 复制 ， 可 以 完成 目标 文件 格式 的 转换 等 
readelf 显示 ELF 格式 目标 文件 的 信息 

size 显示 目标 文件 或 者 归档 文件 中 节 区 (Section) 的 大 小 
strings 显示 文件 中 的 可 打印 字符 串 的 信息 

strip 去 除 目 标 文 件 中 的 符号 信息 


例如 ， 对 于 如 下 的 源 代码 : 





[GCC@localhost test]$ сас test.c 
int main(){ 


return sum; 




















可 以 使 用 objdump 进 行 目标 代码 的 反 汇 编 : 


[GCC@1localhost test]$ асс -c -o test.o test.c 
[GCC@1localhost test]$ objdump -d test.o 

test .0: file format elf32-i386 
Disassembly of section .text: 


00000000 <таіп>: 


0: 55 push Ферр 

1; 89 е5 mov %esp, %ерр 

3; 83 ec 10 sub $0x10, $esp 

6: с7 45 f8 00 00 00 00 movl 50х0,-0х8 (Ферр) 
а: с7 45 їс 00 00 00 00 movl $0x0,-0x4 (%ерр) 
14: 8b 45 f8 mov -0x8 (%ebp) , eax 
175 01 45 fc ааа Seax, -0x4 (%ерр) 
1а: 8b 45 fc mov -0x4 (%ebp) ,Феах 
1d: с9 leave 

1е: сз ret 











可 以 使 用 nm 查看 目标 文件 中 的 符号 信息 : 











[GCC@localhost test]$ nm test.o 
00000000 T main 
































也 可 以 使 用 readelf 工 具 查 看 目标 文件 的 ELF 信 息 。 

















[GCC@localhost test]$ readelf -a test.o 


ELF Header: 
Magic: 7f 45 4с 46 01 01 01 00 00 00 00 00 00 00 00 00 
Class: ELF32 
Data: 2's complement, little endian 
Version: 1 (current) 
OS/ABI: UNIX - System У 
ABI Version: 0 
Type: REL (Relocatable file) 
Machine: Intel 80386 
Version: 0х1 
Entry point address: 0х0 
Start of program headers: 0 (bytes into file) 
Start of section headers: 200 (bytes into file) 
Flags: 0х0 
Size of this header: 52 (bytes) 
Size of program headers: 0 (bytes) 
Number of program headers: 0 
Size of section headers: 40 (bytes) 
Number of section headers: 9 


Section header string table index: 6 
Section Headers: 


[Nr] Name Type Addr off Size ES Flg Lk Inf Al 
[ 01 NULL 00000000 000000 000000 00 о оо 
[ 1] .text PROGBITS 00000000 000034 00001Ғ 00 АХ 0 0 4 
[ 2] .data PROGBITS 00000000 000054 000000 00 ЖА 0 0 4 
[ 3] .bss NOBITS 00000000 000054 000000 00 ЖА 0 0 4 
[ 41 .comment PROGBITS 00000000 000054 00002е 01 MS 0 0 1 
[ 5] .note.GNU-stack PROGBITS 00000000 000082 000000 00 0 0 1 
[ 6] .shstrtab STRTAB 00000000 000082 000045 00 б 021 
[ 7] .symtab SYMTAB 00000000 000230 000080 10 8 7 4 
[ 8] .strtab STRTAB 00000000 000250 00000d 00 0.01 
Key to Flags: 


W (write), A (alloc), Х (execute), М (merge), 5 (strings) 
I (info), L (link order), G (group), x (unknown) 
О (extra OS processing required) о (05 specific), р (processor specific) 
There are no section groups in this file. 
There are no program headers in this file. 
There are no relocations in this file. 
There are no unwind sections in this file. 
Symbol table '.symtab' contains 8 entries: 


Num: Value Size Type Bind Vis Ndx Name 
0: 00000000 0 NOTYPE LOCAL DEFAULT UND 
1: 00000000 0 FILE LOCAL DEFAULT ABS test.c 
2: 00000000 0 SECTION LOCAL DEFAULT 1 
3: 00000000 0 SECTION LOCAL DEFAULT 2 
4: 00000000 0 SECTION LOCAL DEFAULT 3 
5: 00000000 0 SECTION LOCAL DEFAULT 5 
6: 00000000 0 SECTION LOCAL DEFAULT 4 
7: 00000000 31 FUNC GLOBAL DEFAULT 1 main 


No version information found in this file. 





24 shell 工 具 及 graphviz 绘 图 工具 

















为 了 更 好 地 分 析 GCC 的 运行 过 程 ， 可 以 使 用 GCC 支持 的 一 些 编译 选项 ， 例 如 ，-fdump-tree-all、-fudmp-ipa-all、-fdump-rtl-all 等 ， 这 样 编译 过 程 中 将 产生 大 量 的 中 间 运 行 结果 信息 ， 帮 助 用 户 理解 
GCC 的 处 理 细节 。 另 外 ， 用 户 也 可 以 根据 需要 在 源 代码 中 增加 适当 的 调试 代码 ， 从 而 输出 一 些 运 行 时 的 中 间 信 息 。 对 这 些 输出 结果 进行 高 效 分 析 ， 从 中 提取 有 价值 的 信息 是 GCC 分 析 过 程 中 非常 关键 的 一 种 


















































笔者 认为 ， 借 助 于 Linux shell 命 令 的 强大 字符 串 处 理 功 能 ， 可 以 极 大 地 提高 信息 处 理 的 效率 。 例 如 ， 可 以 使 用 grep 对 输出 中 的 特定 模式 进行 匹配 ， 利 用 sed 对 输出 的 信息 进行 各 种 强大 的 编辑 处 理 ， 包 
括 蔡 换 、 修 改 等 ， 利 用 awk 可 以 对 输出 结果 进行 进一步 的 处 理 。 建 议 读 者 熟练 使 用 grep、sed、awk 等 工具 ， 并 能 熟练 编写 一 些 简单 的 处 理 脚本 。 


































































































另 一 方面 ， 图 形 直观 生动 ， 擅 长 展示 逻辑 关系 ， 因 此 ， 为 了 说 明 问 题 ， 往 往 需要 对 处 理 结果 进行 图 形 方式 的 展示 ，graphviz 提 供 的 绘图 工具 (http://www.graphviz.org/) 就 是 笔者 进行 GCC 分 析 时 常 
形 生成 工具 。 
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例如 ， 对 于 如 下 的 源 代码 test.c: 








GCCehost2 g2r]$ cat test.c 
int global int = 0; 
int main (int argc, сһаг *argv[]) 
1 
іпе і; 
static int static sum=0; 
int аггау[10]={0,1,2,3,4,5,6,7,8,9}; 
for (i=global int; i<10; i++){ 
іле 1-із2; 
static sum = static sum + j + аггау[1]; 
if (static_sum>1000) goto Label ВЕТ; 
} 
Label RET: 
return static sum; 


} 





通过 在 GCC 中 增加 调试 代码 ， 可 以 生成 main 函 数 的 控制 流 图 文件 Control_Flow.dot。 


[GCC@host2 g2r]$ cat Control Flow.dot 
digraph G { Е 

поде [shape = гесога]; 
0 [label = "{ЕМТКҮ}"]; 
0 -> 2 [style=solid, label=fallthru]; 
2 [label = "ІВв-2)"1; 
2 -> 6 [style=solid, label=fallthru]; 


label = "{ВВ-3}"]; 
-> 4 [style=solid, label=true]; 
-> 5 [style=solid, label=false]; 
label = "{ВВ-4}"]; 
-> 7 [style=solid, label=fallthru]; 
label = "{BB-5}"]; 
-> 6 [style=solid, label=fallthru]; 
= "{BB-6}"]; 
-> 3 [style=solid, label=true]; 
-> 7 [style=solid, label=false]; 
label = "{ВВ-7}"]; 
-> 8 [style=solid, label=fallthru]; 
label = "{ВВ-8}"]; 
-> 1 [style=solid]; 
label = "(ЕХІТ}"]; 
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显然 ， 该 控制 流 图 是 不 直观 、 不 容易 理解 的 ， 然 而 通过 将 Control_Flow.dot 中 描述 的 逻辑 关系 转换 成 graphviz 的 图 形 脚本 ， 就 可 以 利用 graphviz 中 dot 工 具 生成 其 
4 所 示 。 




















示 结 果 Control_Flow.png， 如 








|!) 








dot -Tpng -о Control Flow.png Control Flow.dot 
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图 2-4 函数 控制 流程 图 的 图 示 

















可 以 看 出 ， 使 用 图 形 表示 可 以 非常 直观 地 展示 程序 中 的 控制 流程 ， 也 为 代码 分 析 提 供 了 最 直观 形象 的 辅助 。 



























































再 举 一 例 。 在 分 析 GCC 的 AsT 生 成 及 GIMPLE 生 成 等 过 程 中 ， 需 要 了 解 AsT 节 点 的 具体 内 容 及 其 相互 关系 ， 此 时 ， 也 可 以 通过 对 GCC 生成 的 AsT 中 间 结 果 进 行 脚本 的 处 理 ， 并 生成 














ul 
iR] 
































5 给 出 了 上 述 源 代码 中 sum=a+b 语 句 对 应 的 关键 AST 节 点 及 其 相互 关系 ， 该 结果 形象 直观 ， 节 点 之 间 的 关系 清晰 ， 对 于 分 析 AsT 的 生成 和 GIM PLE 转 换 等 都 














有 非常 和 





要 的 意义 。 











示 结 果 ， 例 如 





区 
















21: modify expr 


31: var decl 33: plus expr 


35: 1dentifier node 8: var decl í 


12: identifier node 30: identifier node 


strg: a strg: b 














14: var decl 









图 2-5 sum=a+b 对 应 的 AST 片 段 图 示 
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GCC 本 身 对 包含 了 众多 的 调试 选项 ， 既 可 以 为 用 户 程序 生成 调试 信息 ， 也 可 以 将 GCC 运行 过 程 中 的 关键 信息 保存 在 文件 或 输出 在 终端 上 ， 常 用 的 调试 选项 如 表 2-2 所 示 。 如 果 需 要 了 解 GCC 在 处 理 的 各 
个 阶段 里 中 间 表 示 的 具体 内 容 ， 或 者 需要 了 解 GCC 中 某 个 处 理 过 程 对 于 中 间 表 示 的 处 理 细节 时 ， 就 可 以 使 用 表 2-2 中 给 出 的 各 种 GCC 调试 选项 ， 输 出 GCC 运行 过 程 中 所 生成 的 中 间 表 示 的 调试 信息 和 处 理 过 
程 细 节 ， 并 结合 GCC 的 代码 ， 从 而 了 解 GCC 的 具体 工作 细节 。 









































表 2-2 GCC 主要 的 调试 选项 


调试 选项 形式 及 
作用 
-fdump-tree-switch 
-fdump-tree-switch-options 
输出 GCC 编译 过 程 中 与 AST、 
GIMPLE 等 树 节 点 中 间 表 示 相 关 
的 调试 信息 


-fdump-ipa-switch 

输出 与 IPA 相关 的 调试 信息 
-fdump-rtl-pass alignments 
输出 与 RTL 中 间 表 示 相 关 的 调 |asmcons 


试 信息 auto_inc_dec 


compgotos 
cel 
cprop_hardreg 


例 2-1 ”GCC 调试 选项 的 使 用 


假设 有 如 下 的 源 代码 : 


switch/pass 的 主要 取 值 


storeccp 

pre 

fre 

сорургор 

віоге сорургор 
dce 

mudflap 

STa 


Sink 


init 


initvals 


into_cfglayout 


ira 
jump 

loop2 

mach 

mode sw 

rnreg 

outof cfglayout 
peephole2 
postreload 
pro_and_epllogue 
regmove 

sched1 

see 

shorten 





举例 


dom -fdump-tree-all 


dse -fdump-tree-original-raw 
phiopt fdump-tree-cfg-all 
forwprop 
copyrename 
ПГУ 

vect 

угр 

all 

inline fdump-ipa-cgraph 
fdump-ipa-all 
Sibling fdump-rtl-ira 
fdump-rtl-sched1 
fdump-rtl-expand 


fdump-rtl-all 


splitl 

sms 

stack 
subreg1 
subreg2 
subreg1 
unshare 
vartrack 
vregs 

web 
regclass 
Subregs of 
mode finish 
dfinit 
dfinish 

all 





[GCCQlocalhost test]$ сас test.c 
int main(){ 

int i=0, sum=0; 

sum = вш + і; 

return виш; 


i 














为 了 了 解 GCC 对 该 文件 编译 过 程 中 的 主要 处 理 过 程 ， 可 以 使 








如 下 命令 输出 GCC 处 理 过 程 的 主要 调试 信息 和 工作 流程 。 





[GCC@localhost test]$ ~/paag-gcc/host-i686-pc-linux-gnu/gcc/ccl -fdump-tree-all -fdump-rtl-all test.c 


[GCCQlocalhost test]$ ls test.c* 


171r.subregs of mode init 


173r.subregs of mode finish 


ъеѕі.с test.c.123t .optimized test.c.168r.asmcons 
test.c.001t.tu test.c.125t.blocks test.c. 
test.c.003t.original test.c.126t.final cleanup test.c.172r.ira 
test.c.004t.gimple test.c.128r.expand еѕі.с. 
test.c.006t.vcg test.c.129r.sibling test.c.176r.split2 
test.c.007t.useless test.c.131r.initvals test.c.178r.pro_and epilogue 
test.c.010t.lower test.c.132r.unshare test.c.192r.stack ` 
test.c.011t.ehopt test.c.133r.vregs test.c.193r.alignments 
test.c.012t.eh test.c.134r.into cfglayout test.c.196r.mach 
test.c.013t:cfg test.c.135r.jump test.c.197r.barriers 
test.c.014t.cplxlower0 test.c.154r.reginfo test.c.200r.eh_ranges 
test.c.015t.veclower test.c.157r.outof cfglayout test.c.201r.shorten 
test.c.021t.cleanup cfg test.c.163r.splitl test.c.202r.dfinish 
test.c.023t.ssa test.c.165r.dfinit test.c.203t.statistics 
test.c.038t.release ssa test.c.166r.mode sw 





可 以 看 出 ， 此 时 输出 的 各 种 调试 文件 名 称 格式 为 : test.c.nnn[r/tj.name， 其 中 nnn 为 一 个 编号 ，t 表 示 该 处 理 过 程 是 基于 tree 的 GIMPLE 处 理 过程 ，r 表 示 该 处 理 过 程 是 基于 RTL 的 处 理 过 程 。 如 果 读 者 关 
注 函 数控 制 流 图 (CFG, Control Flow Graph) 的 信息 ， 





那么 可 以 打开 test.c.013t.cfg 文 件 ， 查 看 其 中 的 
































体内 容 。 内 容 如 下 : 





[GCCQ&localhost test]$ сас test.c.013t.cfg 
2; Function main (main) 
Merging blocks 2 and 3 
main () 
{ 
int sum; 
int i; 


int р.1234; 
<bb 2>: 

i= D; 

sum = 0; 

sum = Sum + i; 

D.1234 = sum; 

return D.1234; 











其 中 就 包含 了 例子 中 给 出 函数 的 控制 流 


Ий] 




















， 如 果 想 了 解 更 详细 的 CFG 信 息 ， 也 可 以 使 用 如 下 的 编译 形式 : 











[GCC@1localhost test]$ ~ /раад-дсс/һоѕі-1686-рс-1іпих-дпи/осс/сс1 -fdump-tree-cfg-all test.c 


[GCC@localhost test]$ cat test.c.013t.cfg 
2; Function main (main) 
Scope blocks: 
{ Scope block #0 
intD.0 iD.1232; (unused) 
intD.0 sumD.1233; (unused) 
} 
Равв statistics: 
Merging blocks 2 апа 3 
main () 
1 
intD.0 вшар.1233; 
intD.0 ір.1232; 
intD.0 р.1234; 
# BLOCK 2 
# PRED: ENTRY (fallthru) 
iD.1232 = 0; 
sumD.1233 = 0; 
sumD.1233 = sumD.1233 + iD.1232; 
D.1234 = sumD.1233; 
return D.1234; 
# SUCC: EXIT 
} 





可 以 看 出 ，GCC 编 译 时 会 生成 更 加 详细 的 CFG 信 息 。 




















读者 也 可 以 根据 自己 的 需要 ， 合 理 地 使 用 表 2-2 中 的 调试 选项 ， 输 出 GCC 编译 过 程 中 感 兴趣 的 调试 信息 ， 从 而 分 析 GCC 的 工作 细节 。 


GCC 是 一 个 复杂 的 软件 系统 ， 例 如 gcc-4.4.0.tar.gz 软 件 包 中 包含 了 成 干 上 万 个 文件 。 本 章 主要 对 GCC 的 代码 结构 和 目录 结构 进行 介绍 ， 阐 明 GCC 的 





要 步骤 和 关键 问题 。 


3.1 GCC 的 目录 结构 


第 3 章 GCC 总 体 结构 











要 模块 及 其 


相互 关系 ， 并 给 出 GCC 源 代码 编译 的 


GCC 的 源 代码 可 以 从 GCC 的 官网 (https://gcc.gnu.org) 上 获得 。 该 源 代码 包 主要 包括 bz2 和 gz 两 种 压缩 形式 的 tar 包 ， 以 gcc-4.4.0 为 例 ， 分 别 为 gcc-4.4.0.tar.bz2 及 gcc-4.4.0.tar.gz。 














可 以 通过 如 下 的 命令 获取 gcc-4.4.0.tar.bz2 人 代码， 进行 源 代码 包 的 解压 ， 并 查看 其 主要 的 目录 结构 。 





[GCC@host2 gcc-4.4.0]$ wget -c http://www.netgull.com/gcc/releases/gcc-4.4.0/gcc-4.4.0.tar.bz2 


[GCC@host2 дсс-4.4.015 tar -xjvf gcc-4.4.0.tar.bz2 
[GCC@host2 gcc-4.4.0]$ cd gcc-4.4.0; ls 


ABOUT-NLS COPYING.LIB libgfortran 
boehm-gc COPYING.RUNTIME 11Бдошр 
ChangeLog depcomp libiberty 
ChangeLog.tree-ssa fixincludes libjava 
compile gcc libmudflap 
config gnattools libobjc 
config.guess include libssp 
config-ml .in INSTALL libstdc++-v3 
config.rpath install-sh libtool-ldflags 
config. sub intl libtool.m4 
configure LAST_UPDATED ltgcc.m4 
configure.ac libada ltmain.sh 
contrib libcpp lt~obsolete.m4 
COPYING libdecnumber ltoptions.m4 
COPYING3 libffi ltsugar.m4 
COPYING3.LIB libgcc ltversion.m4 


MAINTAINERS 
maintainer-scripts 
Makefile.def 
Makefile.in 
Makefile.tpl 
Мр550М5 
missing 

mkdep 
mkinstalldirs 
move-if-change 
NEWS 

README 
symlink-tree 
tags 

ylwrap 

zlib 





该 源 代码 目录 中 的 主要 内 容 包 括 : 


=” 


(1) 与 GCC 编译 配置 有 关 的 config* 文 件 。 

















(2) lib* 目 录 : 各 种 各 样 的 库 文件 ， 既 包括 一 些 通 用 的 库 文件 ， 也 包含 一 些 与 语言 相关 的 库 文件 ， 例 如 libcpp 中 包含 与 C+ + 语言 相关 的 代码 库 文件 ，libada 中 包含 与 ADA 语 言 相关 的 代码 库 文件 。 








(3) gcc 目 录 中 包含 GCC 的 核心 代码 ， 包 括 了 与 各 种 编程 语言 相关 的 词法 、 语 法 等 前 端 分 析 程 序 ， 与 各 种 目标 机 器 相关 的 机 器 描述 文件 ， 以 及 与 前 











使 用 如 下 shell 命 令 可 以 列 出 gcc 目 录 中 的 所 有 子 目录 ， 





[GCC@host2 gcc-4.4.0]$ ls -1 gce | 
drwxrwxr-x. 3 ССС ССС 69632 Арг 
агихгихг-х. 37 ССС ССС 4096 Арг 
агихгихг-х. 2 ССС ССС 4096 Арг 
drwxrwxr-x. 3 ССС ССС 4096 Арг 
агихгихг-х. 2 ССС ССС 4096 Арг 
агихгихг-х. 2 ССС ССС 4096 Арг 
drwxrwxr-x. 2 ССС ССС 4096 Арг 
агихгихг-х. 2 ССС ССС 4096 Арг 
агихгихг-х. 2 ССС ССС 4096 Арг 
drwxrwxr-x. 2 ССС ССС 4096 Арг 
drwxrwxr-x. 18 ССС ССС 4096 Арг 














中 包含 如 下 的 一 些 子 目录 : 





端 语言 无 关 且 与 机 器 无 关 的 核心 处 理 代码 等 。 





21 2009 ада 

21 2009 config 
21 2009 ср 

21 2009 аос 

21 2009 fortran 
21 2009 ginclude 
21 2009 java 

21 2009 objc 

21 2009 objcp 
21 2009 ро 

21 2009 testsuite 











C++ 等 ，C 语 言 的 处 理 则 是 GCC 默认 的 处 理 前 端 语言 ， 其 部 分 处 理 代 码 在 gcc/ 目 录 中 。 





з == 


gcc 目 录 下 的 gcc/cp、gcc/fortran、gcc/java、gcc/objc、gcc/objcp 等 子 目录 就 是 与 各 种 编程 语言 相关 的 处 理 部 分 ， 这 几 个 目录 分 别处 理 编程 


Т5 25 


С++, Fortran, Јама, Object С, Object 


进一步 查看 gcc/config 目 录 中 所 包含 的 子 目录 : 





[GCC@host2 gcc-4.4.0]$ ls -l gcc/config | grep ^а 
drwxrwxr-x. 2 GCC GCC 4096 Арг 21 2009 alpha 
агихгихг-х. GCC ССС 4096 Арг 21 2009 arc 
агихгихг-х. 
агихгихг-х. 


ССС ССС 4096 Арг 21 2009 агт 
ССС ССС 4096 Арг 21 2009 avr 
ССС ССС 4096 Арг 21 2009 bfin 
GCC ССС 4096 Арг 21 2009 cris 
GCC ССС 4096 Арг 21 2009 сгх 
GCC ССС 4096 Арг 21 2009 fr30 
GCC ССС 4096 Арг 21 2009 frv 
GCC ССС 4096 Арг 21 2009 Һ8300 
ССС ССС 4096 Арг 21 2009 1386 
ССС ССС 4096 Арг 21 2009 ia64 
ССС ССС 4096 Арг 21 2009 142000 
ССС ССС 4096 Арг 21 2009 п32с 
GCC ССС 4096 Арг 21 2009 m32r 
GCC ССС 4096 Арг 21 2009 m68hc11 
GCC ССС 4096 Арг 21 2009 m68k 
ССС ССС 4096 Арг 21 2009 тсоге 
GCC ССС 4096 Арг 21 2009 mips 
GCC ССС 4096 Apr 21 2009 mmix 
GCC ССС 4096 Арг 21 2009 шп10300 
ССС ССС 4096 Арг 21 2009 ра 

GCC ССС 4096 Арг 21 2009 рар11 
GCC ССС 4096 Арг 21 2009 рісосһір 
GCC ССС 4096 Арг 21 2009 rs6000 
GCC ССС 4096 Арг 21 2009 5390 
GCC ССС 4096 Арг 21 2009 score 
GCC ССС 4096 Арг 21 2009 sh 

ССС ССС 4096 Арг 21 2009 soft-fp 
GCC ССС 4096 Арг 21 2009 sparc 
GCC ССС 4096 Арг 21 2009 spu 
ССС ССС 4096 Арг 21 2009 stormy16 
GCC ССС 4096 Арг 21 2009 у850 
GCC ССС 4096 Арс 21 2009 vax 
ССС ССС 4096 Арг 21 2009 xtensa 
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从 目录 的 名 称 上 就 可 以 看 出 来 ， 这 些 目录 分 别 对 应 了 各 种 不 同 的 目标 机 器 名 称 。 目 录 中 包含 的 内 容 就 是 针对 不 同 目标 机 器 的 机 器 描述 文件 ， 包 括 md 文 件 及 相应 的 文件 和 h 文 件 等 。 例 如 i386 目 录 中 包含 
了 Intel x86 处 理 器 的 机 器 描述 文件 等 ，arm 目 录 中 则 包含 了 ARM 处 理 器 的 机 器 描述 文件 等 。 




















完整 的 目录 结构 说 明 请 查阅 GCC 相关 说 明文 档 。 也 可 以 参考 Uday Khedker 的 《GCC Source Code: An Internal View) (http://www.cse.iitb.ac.in/grc/) 。 


32 ”GCC 的 逻辑 结构 








GCC 的 源 代码 文件 数量 庞大 ， 目 录 结 构 复杂 ， 总 体 结构 理解 有 一 定 的 难度 ， 但 从 代码 功能 和 逻辑 结构 上 来 讲 ， 这 些 代码 大 致 可 以 分 为 如 图 3-1 所 示 的 几 个 部 分 。 
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图 3-1 GCC 与 gcc 的 逻辑 结构 

















司 3-1 分 为 上 下 两 个 部 分 ， 上 半 部 分 使 用 GCC 表示 GCC 4.4.0 的 源 代 码 内 容 ， 下 半 部 分 使 用 gcc/cc1 表 示 使 用 GCC 源 代码 编译 生成 的 编译 器 程序 。 









































到 3-1 的 上 半 部 分 根据 源 代 码 的 功能 将 GCC 源 代码 分 为 4 大 部 分 : 


























(1) 高 级 语言 相关 代码 (High-Level-Language Specific Code) 。 在 GCC 的 源 代 码 中 ， 对 于 GCC 能 够 编译 的 每 一 种 编程 语言 都 有 其 相应 的 处 理 代 码 ， 这 些 代码 主要 集中 在 
${GCC_SOURCE}/${Language} 目 录 下 。 其 中 $fLanguage} 代 表 了 编程 语言 的 名 称 ， 这 部 分 代码 主要 完成 高 级 编程 语言 的 词法 、 语 法 分 析 等 功能 ， 从 而 生成 该 语言 对 应 的 抽象 语法 树 (AST，Abstract 
Syntax TREE) ， 并 完成 其 规范 化 (бепегісіге) 操作 。 





























(2) 与 编程 语言 和 目标 机 器 无 关 的 通用 代码 (Language&Machine Independent Generic Code) 。 这 部 分 代码 主要 包括 $fGCC_SOURCE}/ 目 录 下 的 代码 ， 用 于 完成 GIMPLE 和 RTL 的 生成 ， 以 及 数 
量 庞大 的 基于 GIMPLE 和 RTL 的 处 理 及 编译 优化 工作 。 


























(3) 机 器 描述 (Machine Descriptions) 代码 。 一 般 来 说 ， 对 于 GCC 支 持 的 每 一 种 名 称 为 $ftarget} 的 目标 机 器 ， 在 GCC 的 代码 中 均 有 一 个 名 称 为 GCC_SOURCE}/config/${ftarget} 的 子 目 录 ， 用 来 
存放 与 该 目标 机 器 相关 的 机 器 描述 代码 及 其 相应 的 头 文件 和 c 文 件 等 。 



































(4) 与 目标 机 器 相关 的 生成 器 代码 (Machine Dependent Generator Code) 。 这 部 分 代码 比较 难以 理解 ， 读 者 可 以 试 着 这 样 来 考虑 。 为 了 生成 目标 机 器 上 编译 器 程序 cc1，GCC 提 供 的 源 代码 在 设 


计 阶 段 是 不 完整 的 ， 其 中 缺少 的 部 分 主要 包括 目标 机 器 相关 的 RTL 构 造 及 目标 代码 生成 等 部 分 的 源 代 码 。 由 于 这 一 部 分 源 代码 是 与 目标 机 器 相关 的 ， 在 GCC 设计 源 代码 时 是 难以 确定 的 ， 因 此 ，GCC 采 用 了 




































































这 样 一 种 解决 的 思路 ， 就 是 通过 一 些 生成 器 (Generator) 代码 ， 这 些 代码 能 够 根据 目标 机 器 的 机 器 描述 文件 ， 提 取 目 标 机 器 的 信息 ， 从 而 自动 地 生成 关于 目标 机 器 上 RTL 构 造 及 目标 代码 生成 的 源 代 码 ， 并 
将 这 些 源 代码 与 GCC 原 有 的 其 他 代码 结合 在 一 起 编译 ， 从 而 生成 与 目标 机 器 相关 的 编译 器 程序 。 与 目标 机 器 相关 的 生成 器 代码 的 文件 名 称 一 般 为 ${(GCC_SOURCEMgen*.[ch]， 其 主要 的 功能 就 是 根据 机 器 描 
述 文件 生成 与 目标 机 器 相关 的 部 分 源 代码 。 
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此 ， 最 终 参与 编译 ， 生 成 目标 机 器 编译 器 的 源 代码 主要 包括 了 语言 相关 的 代码 、 语 言及 机 器 无 关 的 通用 代码 ， 以 及 根据 机 器 描述 文件 由 机 器 相关 代码 生成 器 所 生成 的 代码 等 三 部 分 。 




















到 3-1 的 下 半 部 分 给 出 了 根据 上 述 GCC 的 源 代码 所 生成 的 目标 机 器 上 编译 器 cc1 (gcc 程 序 所 调用 的 编译 器 ) 的 主要 工作 流程 。 从 整体 上 看 ， 目 标 机 器 上 编译 器 cc1 的 功能 就 是 将 用 户 输入 的 高 级 程序 代码 





最 终 编译 成 目标 机 器 上 的 汇编 代码 ， 其 中 经 历 了 前 端的 词法 分 析 、 语 法 分 析 、 语 义 分 析 ， 中 间 的 GIMPLE 生 成 、GIMPLE 优 化 ， 以 及 后 端的 RTL 生 成 、RTL 优 化 、 代 码 生成 等 几 个 步骤 。 在 这 些 处 理 过 程 
中 ，GCC 也 分 别 使 用 几 种 不 同 的 中 间 表 示 (Intermediate Representation, IR) 形式 ， 包 括 AST、GIMPLE、RTL 等 。 这 些 处 理 步骤 与 上 半 部 分 的 代码 具有 一 定 的 对 应 关系 ， 例 如 词法 、 语 法 分 析 以 及 AST 


的 规范 化 过 程 对 应 上 半 部 分 的 “高 级 语言 相关 代码 ”; GIMPLE 生 成 、GIMPLE 优 化 及 RTL 优 化 部 分 则 对 应 上 半 部 分 的 “与 编程 语言 和 目标 机 器 无 关 的 代码 ”; RTL 生 成 以 及 最 终 的 汇编 代码 生成 部 分 则 由 上 


半 部 分 的 




































































“与 目标 机 器 相关 的 生成 器 代码 ”根据 上 半 部 分 的 “机 器 描述 ”生成 。 

















对 图 3-1 的 上 半 部 分 和 下 半 部 分 进行 对 照 ， 可 以 看 出 不 同 部 分 的 GCC 源 代码 在 功能 上 的 差异 。 

















本 书 在 分 析 GCC 时 ， 也 是 按照 cc1 的 执行 流程 ， 围 绕 各 种 中 间 表 示 的 生成 和 处 理 进行 深入 分 析 ， 从 而 帮助 读者 理解 GCC 设计 的 关键 思路 和 技术 ， 主 要 包括 : 


第 4 章 
第 5 章 


第 6 章 3 























要 以 C 语 言 为 例 ， 介 绍 GCC 前 端 对 于 高 级 语言 进行 词法 、 语 法 分 析 ， 从 而 生成 其 AsT 的 过 程 ， 重 点 描述 了 其 中 AsT 的 表示 、 存 储 结构 及 其 操作 等 。 


要 描述 GIM PLE 中 间 表 示 的 生成 过 程 。 








要 描述 基于 GIM PLE 中 间 表 示 的 各 种 编译 优化 ， 这 些 优化 大 多 是 基于 静态 单 赋值 (Static Single Assignment, SSA) 形式 的 GIMPLE 表 示 ， 而 且 都 是 与 目标 机 器 无 关 的 优化 。 


第 7 章 详细 地 介绍 了 GCC 中 RTL 中 间 表示 的 基本 概念 ， 并 对 其 类 型 、 存 储 以 及 操作 做 了 详细 描述 。 


第 8 章 3 
描述 和 实例 

















其 作用 。 








第 10 章 3 


第 11 


第 12 章 


第 9 章 




















EF 要 介绍 GCC 中 机 器 描述 文件 $ftarget}.md 的 指令 模板 的 基本 概念 及 其 主要 内 容 ， 并 对 机 器 描述 文件 中 define_insn、define_expand、define_split、define_peephole 等 主要 操作 进行 了 详细 的 
说 明 ， 这 些 内 容 对 于 理解 机 器 描述 文件 和 用 户 机 器 描述 文件 至 关 重 要 。 


















































要 对 GCC 中 机 器 描述 文件 的 < 文件 和 头 文件 进行 了 详细 描述 。 这 些 内容 也 为 第 12 章 的 GCC 向 新 处 理 器 的 移植 做 了 充分 的 准备 。 另 外 ，9.9 节 则 重点 介绍 了 与 目标 机 器 相关 的 生成 器 代码 的 结构 及 


要 描述 RTL 中 间 表 示 的 生成 技术 。 














章 主要 描述 基于 RTL 中 间 表 示 的 优化 技术 ， 这 些 优化 大 部 分 是 与 目标 机 器 相关 的 。 

















点 给 出 将 GCC 移植 到 新 的 处 理 器 的 基本 过 程 和 实例 。 


关于 GCC 代码 的 结构 ， 也 可 以 参考 Abhijat Vichare 的 《GCC-conceptual-structure》 (http://www.cse.iitb.ac.in/grc/) 。 


3.3 ”GCC 源 代码 编译 


在 获得 了 GCC 的 源 代码 后 ， 为 了 生成 目标 机 器 上 的 编译 器 程序 ， 需 要 对 源 代码 进行 编译 ， 一 般 步 又 包括 : 


(1) 


(2 


(3) 











使 











使 


configure 脚 本 完成 编译 配置 ， 生 成 Makefile 文 件 。 














使 





make 工 具 编译 源 代码 。 




















使 











make 工 具 安装 生成 的 编译 程序 等 。 











的 典型 脚本 为 : 


./configure 


make 


make install 


第 4 章 ”从 源 代码 到 AST/GENERIC 














ра 





使 





高 级 语言 编写 的 程序 源 代 码 需要 转换 成 目标 机 器 代码 才能 执行 ， 在 这 个 过 程 中 ， 首 先 需要 将 源 代 码 转换 成 目标 机 器 的 汇编 代码 。 编 译 器 的 主要 功能 就 是 完成 源 代码 到 目标 机 器 汇编 代码 的 转 





























换 ， 这 个 转化 过 程 往往 不 能 一 跳 而 就 ， 原 因 就 在 于 难以 找到 一 种 可 以 直接 将 高 级 语言 映射 到 目标 机 器 汇编 代码 的 映射 规则 ， 而 且 ， 即 使 可 以 直接 转化 成 目标 机 器 的 汇编 代码 ， 其 转换 的 效率 和 代码 质量 往往 
也 非常 低 效 。 





























因此 ， 在 实际 的 编译 系统 中 ， 从 源 代码 到 汇编 代码 的 转换 过 程 通 常 被 划分 成 多 个 转换 阶段 ， 包 括 从 源 代码 到 中 间 表 示 1、 中 间 表 示 2，.…， 中 间 表 示 n， 再 到 最 终 的 汇编 代码 的 转换 。 每 个 阶段 使 用 不 同 的 



































中 间 表 示 (Intermediate Representation, IR) 形式 。 中 间 表 示 的 采用 不 仅 可 以 方便 支持 各 种 各 样 的 优化 处 理 ， 也 可 以 使 编译 器 的 核心 处 理 功能 与 前 端 语 言 和 后 端的 目标 机 器 相 独 立 ， 便 于 编译 器 对 多 种 语 
言及 多 种 机 器 的 支持 。 
如 图 4-1 所 示 ，GCC 在 将 高 级 程序 源 代 码 转换 成 目标 机 器 汇编 代码 的 过 程 中 ， 主 要 使 用 了 三 种 中 间 表 示 形 式 ， 即 抽象 语法 树 (Abstract Syntax Tree, AST) 、GIMPLE 及 寄存 器 传输 语言 (Register 






































Transfer Language, RTL) 。 本 书 就 紧 紧 围绕 这 三 种 中 间 表 示 的 基本 概念 、 表 示 方 法 、 存 储 结构 及 其 生成 技术 等 展开 。 

















源 代码 抽象 语法 树 (AST) GIMPLE 寄存 器 传输 语言 (RTL) 汇编 代码 
д А А 
келемын т знн 


41 GCC 中 的 主要 中 间 表 示 

















本 章 主 要 介绍 AsT 中 间 表 示 的 基本 概念 ， 以 及 从 源 代码 生成 AsT 的 过 程 。 


4.1 抽象 语法 树 

















抽象 语法 树 是 编译 系统 中 最 常见 的 一 种 树 形 的 中 间 表 示 形 式 ， 用 来 对 前 端 语言 的 源 代码 进行 规范 的 抽象 表示 。 不 同 的 高 级 程序 设计 语言 通过 其 相应 的 词法 /语法 分 析 过 程 ， 会 得 到 不 同形 式 的 抽象 语法 
树 ， 这 些 抽象 语法 树 与 编程 语言 的 特征 紧密 相关 ， 一 般 都 包含 了 部 分 语言 相关 的 AST 节 点 表示 。 从 这 个 角度 上 来 讲 ，AST 是 编程 语言 相关 的 ， 如 图 4-2 所 示 ，C 语 言 的 源 代 码 经 过 C 语 言 特定 的 词法 /语法 分 析 
过 程 ， 将 生成 C 语 言 的 AST，Java 语 言 的 源 代码 经 过 Java 语 言 特定 的 词法 /语法 分 析 过 程 ， 将 生成 Java 语 言 的 AST， 以 此 类 推 。 









































































C 语 言 СЕН 
май оа CAST 
源 代码 
биледі Java AST 规范 化 
源 代码 GENERIC 
/AST 
C++ 语言 CHAST 
源 代码 词法 /语法 分 析 
Еоптап гї Fortran 语 言 Fortran 
Л E] 词法 /语法 分 析 А5Т 














图 4-2 AST 的 前 端 语言 相关 性 














GENERIC 是 指 规范 的 AST。 一 般 来 说 ， 如 果 一 种 前 端 语言 的 AST 均 可 以 使 用 gcc/tree.h 中 所 表示 的 树 节点 表示 ， 那 么 该 AST 就 是 规范 的 AST， 即 GENERIC 形 式 。 可 以 看 出 ，GENERIC 是 一 种 规范 的 AST 
表示 ,引入 GENERIC 的 目的 就 是 力求 寻找 一 种 与 前 端 语言 无 关 的 AST 统 一 表示 ， 便 于 对 各 种 语言 的 AST 进 行 一 种 通用 的 处 理 而 已 。 从 这 个 角度 上 ， 可 以 把 AST 和 GENERIC 合 起 来 称 为 AST/GENERIC。 
































本 书 以 C 语 言 为 例 ， 说 明 AST 相 关 的 主要 概念 。 例 如 ， 图 4-3 中 给 出 了 GCC 中 描述 C 语 言语 句 “b=a++; ”的 AST 结 构 及 其 主要 节点 信息 。 可 以 看 出 ， 对 于 AST 这 种 树 形 的 中 间 表 示 ， 读 者 期 待 理解 的 内 
容 主要 包括 : 树 节 点 的 种 类 及 其 语义 、 树 节点 的 存储 、AST 操 作 以 及 AST 的 生成 过 程 等 。 














22: modify expr 






18: var_decl : postincrement expr 


ЕЗІЛЕ 


30: 1dentifier node 9: var decl 33: integer cst 


re [om Гас 


17: identifier_node 










图 4-3 ”抽象 语法 树 示例 














GCC 中 对 AsT 节 点 使 用 一 种 联合 体 (union) 数据 结构 来 表示 ， 即 union tree node, union tree_node 是 一 个 庞大 的 、 复 杂 的 数据 结构 ， 是 各 种 各 样 表示 树 节点 结构 体 的 一 个 抽象 描述 。 在 介绍 该 数据 

















42 ， 树 节点 的 声明 


GCC 中 定义 了 很 多 种 类 的 树 节点 ， 本 节 首 先 介绍 这 些 树 节点 的 基本 描述 。 








在 GCC 中 ， 每 种 不 同 的 树 节点 都 具有 一 些 基本 的 描述 信息 ， 主 要 包括 树 节点 的 标识 、 名 称 、 类 型 及 操作 数 个 数 等 。 在 gcc/tree.def 文 件 中 声明 了 GCC 4.4.0 中 所 有 树 节点 的 基本 信息 ， 该 声明 由 一 个 宏 定 
义 描述 ， 形 如 : 





#define DEFTREECODE (SYM, МАМЕ, ТҮРЕ, LEN) 





例如 : 





DEFTREECODE (ERROR MARK, "error mark", tcc exceptional, 0) 








表示 了 一 种 树 节点 ， 其 标识 (TREECODE) ERROR MARK, ERJ "error mark” ， 该 树 节点 的 类 型 (TREE СОРЕ CLASS) 为 tcc_exceptional， 操 作 数 的 个 数 为 0。 


例 4-1 查看 树 节点 的 声明 








为 了 查看 gcc-4.4.0 中 所 定义 的 所 有 树 节点 的 声明 信息 ， 可 以 使 用 如 下 命令 : 

















[GCC@localhost gcc-4.4.0]$ grep ^DEFTREECODE gcc/tree.def 

DEFTREECODE (ERROR MARK, "error mark", tcc exceptional, 0) 

DEFTREECODE (IDENTIFIER NODE, "identifier_node", tcc exceptional, 0) 
DEFTREECODE (TREE LIST, "tree list", tcc exceptional, 0) 

DEFTREECODE (TREE VEC, "tree_vec", tcc exceptional, 0) 

DEFTREECODE (BLOCK, "block", tcc exceptional, 0) 

DEFTREECODE (OFFSET_TYPE, "offset_type", сс буре, 0) 

/ж 限于 篇 幅 ， 中 间 省 略 了 大 量 的 代码 */ 

DEFTREECODE (OPTIMIZATION NODE, "optimization node", tcc exceptional, 0) 
DEFTREECODE (TARGET OPTION NODE, "target option node", tcc exceptional, 0) 





通过 如 下 命令 可 以 获取 gcc-4.4.0 版 本 中 定义 的 树 节点 的 个 数 。 





[gcc@localhost gcc-4.4.0]$ grep ^DEFTREECODE gcc/tree.def | wc -1 
192 





另外 ， 从 例 4-1 中 也 可 以 看 出 树 节点 声明 中 最 基本 的 4 个 概念 : 


(1) 标识 (TREE CODE) : DEFTREECODE 宏 定义 中 的 SYM 参 数 ， 描 述 了 该 节点 代表 的 是 一 个 什么 样 的 节点 ， 可 以 看 作 该 树 节点 的 语义 描述 。 例 如 : 





DEFTRERCODE (PLUS EXPR, "plus expr", tcc binary, 2) 





该 树 节 点 的 TREE_CODE 为 PLUS_EXPR， 用 来 表示 一 个 加 法 操作 语义 的 树 节点 ; 





DEFTREECODE (IDENTIFIER NODE, "identifier поде", tcc exceptional, 0) 





该 树 节点 的 TREE_CODE 为 IDENTIFIER_NODE， 用 来 表示 一 个 标识 符 节 点 ; 





DEFTRERCODE (СТ ЕХРЕ, "gt_expr"，tcc_comparison，2) 





该 树 节点 的 TREE_ CODE 为 GT_EXPR， 用 来 表示 一 个 进行 “大 于 ”比较 操作 的 节点 。 




















(2) 名 称 (МАМЕ) : DEFTREECODE 宏 定义 中 的 NAME 参 数 ， 表 示 该 树 节点 的 名 称 ， 使 用 字符 串 来 描述 ， 来 进行 AST 中 间 结 果 的 显示 ， 方 便 用 户 直 观 地 了 解 该 树 节点 的 信息 。 



























































(3) 类 型 (TREE CODE CLASS, TCC) : DEFTREECODE 宏 定义 中 的 TYPE 参 数 ， 描 述 了 该 树 节点 的 TREE_CODE 所 属 的 类 型 。 





例如 ， 对 于 代表 加 法 、 减 法 和 乘法 运算 的 树 节 点 ， 其 分 别 声明 如 下 : 





DEFTRERCODE (PLUS EXPR, "plus expr", сс binary, 2) 
DEFTREECODE (MINUS EXPR, "minus expr", tcc binary, 2) 
DEFTRERCODE (MULT EXPR, "mult expr", tcc binary, 2) 











可 以 看 出 ， 其 TREE_ CODE 分 别 为 PLUS_EXPR、MINUS_EXPR 及 MULT_EXPR 的 树 节点 ， 分 别 表 示 加 法 、 减 法 和 乘法 语义 ， 而 从 语义 类 型 上 来 说 ， 这 些 运算 树 节点 都 属于 同一 个 类 型 ， 即 双 目 运算 
(tcc_binary) 。 


例 4-2 ”查看 所 有 表示 比较 类 型 的 树 节点 





[gccQ@localhost gcc-4.4.0]$ grep ^DEFTREECODE gcc/tree.def | grep tcc comparison 
DEFTRERCODE (LT EXPR, "lt expr", сс comparison, 2) 


DEFTREECODE (LE EXPR, "le expr", tcc comparison, 2) 
DEFTREECODE (GT EXPR, "gt expr", tcc comparison, 2) 
DEFTREFCODE (СЕ EXPR, "ge expr", tcc comparison, 2) 
DEFTREECODE (EQ EXPR, "ед ехрг", сс comparison, 2) 
DEFTREECODE (МЕ EXPR, "пе expr", {сс comparison, 2) 
DEFTRERCODE (UNORDERED EXPR, "unordered expr", tcc comparison, 2) 


( 
( 
( 
( 
( 
( 
DEFTREECODE (ORDERED EXPR, "ordered expr", tcc comparison, 2) 
( 
( 
( 
( 
( 
( 


DEFTREECODE (UNLT EXPR, "unlt expr", tcc сошрагізоп, 2) 
DEFTREECODE (UNLE EXPR, "unle expr", tcc comparison, 2) 
DEFTREECODE (UNGT_EXPR, "ungt expr", tcc comparison, 2) 
DEFTREECODE (UNGE EXPR, "unge_expr", tcc_comparison, 2) 
DEFTREECODE (UNEQ EXPR, "uneq_expr", tcc comparison, 2) 
DEFTREECODE (LTGT_EXPR, "ltgt_expr", tcc_comparison, 2) 





该 例子 给 出 了 所 有 的 属于 tcc_comparison 类 型 的 树 节点 ， 这 些 树 节点 都 是 表示 比较 运算 的 树 节点 ， 包 括 了 小 于 (LT_EXPR) 、 小 于 等 于 (LE_EXPR) , AF (GT_EXPR) 、 大 于 等 于 (СЕ EXPR) 、 相 
等 (EQ_EXPR) 等 各 种 比较 的 操作 。 





(4) KÆ: DEFTREECODE 宏 定义 中 的 LEN 参 数 ， 用 来 描述 该 树 节 点 所 包含 的 操作 数 的 数目 。 例 如 : 





DEFTREECODE (PLUS EXPR, "plus expr", tcc binary, 2) 











描述 的 树 节点 表示 一 个 加 法 操作 ， 属 于 双 目 运算 ， 其 操作 数 为 两 个 ， 分 别 描述 加 法 操作 中 的 两 个 加 数 。 
对 于 上 述 描述 树 节 点 基本 信息 的 4 个 概念 ， 在 gcc/tree.c 及 gcc/tree.h 中 分 别 定义 了 一 些 数 据 结构 进行 描述 。 


首先 分 析 TREE_CODE 的 定义 。GCC 中 将 所 有 的 TREE_CODE 取 值 保存 在 一 个 枚 举 类 型 enum tree_code 中 。 在 gcc/tree.h 中 有 如 下 定义 : 








/* Codes of tree nodes */ 

#define DEFTREECODE (SYM, STRING, TYPE, NARGS) SYM, 
#define END ОҒ BASE TREE CODES LAST АМО UNUSED TREE CODE, 
enum tree_code { 

#include "all-tree.def" 

МАХ TREE CODES 

1; 

#undef DEFTREECODE 

#undef END OF BASE TREE CODES 











可 以 使 用 如 下 shell 命 令 ， 模 拟 宏 定义 展开 的 结果 : 








[GCC6localhost gcc-4.4.0]$ TREE СОрЕЅ=`сгер ^DEFTREECODE gcc/tree.def | awk -F\ 
( '{print $2}' | awk -F, '{print $1","}'` 
[GCC@localhost gcc-4.4.0]$ саб <<END 

enum tree code { 

5(ТВЕЕ CODES} 

МАХ ТЕЕЕ CODES 

1; 

END 





输出 结果 为 : 





enum tree code ( 
ERROR МАРК, 
IDENTIFIER МОРЕ, 
TREE 119Т, 

TREE ҮЕС, 

BLOCK, 

OFFSET_TYPE, 

/* 限于 篇 幅 ， 中 间 省 略 了 大 量 的 代码 */ 
OPTIMIZATION NODE, 
TARGET ОРТІОМ МОРЕ, 
МАХ ТВЕЕ CODES 

1; 





树 节点 名 称 由 一 个 字符 串 数 组 tree_code_name[] 来 定义 ， 在 gcc/tree.c 中 有 如 下 定义 : 








/% Names of tree components. Used for Printing out the tree апа error шеззадез. %/ 
#define DEFTREECODE (SYM, NAME, TYPE, LEN) NAME, 

#define END OF BASE TREE CODES "@dummy", 

const char *const tree code name[] = { 

#include "all-tree.def" 

1; 

ЖипдеҒ DEFTREECODE 

#undef END ОҒ BASE TREE CODES 





通过 类 似 TREE_ CODE 定义 的 展开 方式 ， 该 字符 串 数 组 tree_code_name[ 中 存放 了 所 有 树 节点 的 名 称 ， 可 以 通过 如 下 代码 对 该 字符 串 数组 的 初 值 进行 查看 。 








[GCC@localhost gcc-4.4.0]$ TREE СОрЕ МАМЕЅ=`сгер ^DEFTREECODE gcc/tree.def | awk '{print $3}'` 
[GCC@localhost gcc-4.4.0]$ сас << END 

Const char *const tree code name[] = { 

${TREE CODE МАМЕ5) 

} 


END 
/* 设置 tree_code_name[] 数 组 的 初 值 */ 
Const char *const tree соде name[] = { 


"error mark", 

"identifier node", 

"tree list", 

"tree vec", 

"hlock", 

"offset_type", 

/ж 限于 篇 幅 ， 中 间 省 略 了 大 量 的 代码 */ 
"optimization node", 
"target_option поде", 














对 于 树 节点 的 类 型 ，gcc/tree.h 中 使 用 枚 举 类 型 enum tree сое _class 定 义 了 GCC 中 所 有 树 节点 类 型 的 取 值 ， 其 定义 如 下 : 














/% Tree code classes. */ 
/* Each tree code has ап associated code class represented by a TREE CODE CLASS. */ 
enum tree code class { 

tcc_exceptional, /* Ап exceptional code (fits no category). */ 


tcc_constant， /% А constant. */ 

їсс type, /% А type object code. */ 

tcc declaration, /* А declaration (also serving as variable refs). */ 
їсс reference, /* A reference to storage. */ 

сс comparison, /% A comparison expression. */ 

їсс unary, /* A unary arithmetic expression. */ 

tcc Біпагу, /* A binary arithmetic expression. */ 

їсс statement, /* A statement expression, which have side effects 


but usually no interesting value. */ 
їсс м1 ехр, /% A function са11 or other expression with а 
variable-length operand Vector */ 
tcc_expression /% Апу other expression. */ 
1; 








可 以 看 出 ， 树 节点 的 类 型 主要 包括 了 常量 节点 、 类 型 节点 、 声 明 节点 、 比 较 表 达 式 节点 、 单 目 运算 表达 式 节 点 、 双 目 运 算 表 达 式 节点 等 。 




















在 gcc/tree.c 中 使 用 数组 tree_code type[ 给 出 了 以 TREE_ CODE 为 索引 的 所 有 树 节点 的 类 型 ， 其 定义 如 下 : 














/% Tree code classes. */ 

#define DEFTREECODE (SYM, МАМЕ, ТҮРЕ, LENGTH) ТҮРЕ, 
#define END OF BASE TREE CODES tcc exceptional, 
const enum tree code class tree code type[] = { 
#include "all-tree.def" 

}; 

#undef DEFTREECODE 

#undef END OF BASE TREE CODES 











其 展开 方式 与 上 述 相 同 ， 不 再 歼 述 。 另 外 ， 关 于 类 型 的 名 称 也 在 gcc/tree.c 中 给 出 了 相关 的 定义 。 





/* Each tree code class has an associated string representation. These must correspond to the tree code class entries. */ 
const char *const tree code class strings[] = 
{ 

"exceptional", 

"constant", 

"type", 

"declaration", 

"reference", 

"comparison", 

"unary", 

"binary", 

"statement", 

"у1 ехр", 

"expression" 


1; 














在 gcc/tree.c 中 使 用 数组 tree_coe_length[] 给 出 了 以 TREE_CODE 为 索引 的 所 有 树 节 点 的 操作 数 个 数 ， 其 定义 如 下 : 














/* Table indexed by tree code giving number of expression operands beyond the fixed part of the node structure. Not used for types or decls. */ 
#define DEFTREECODE (SYM, NAME, TYPE, LENGTH) LENGTH, 

#define END OF BASE TREE CODES 0, 

const unsigned char tree code length[] = { 

#include "all-tree.def" 

1; 

ЖипдеҒ DEFTREECODE 

#undef END ОҒ BASE TREE CODES 

















通过 上 面 的 介绍 可 以 看 出 ，GCC 中 对 一 个 树 节点 的 声明 主要 包括 4 个 方面 ， 即 标识 、 名 称 、 类 型 及 操作 数 个 数 等 ， 并 采用 专门 的 数据 结构 进行 相关 内 容 的 存储 ， 如 表 4-1 所 示 。 


Жал 树 节点 描述 信息 及 其 存储 结构 


Е а 相关 信息 存储 的 数据 结构 Ho 

树 节 点 标识 TREE CODE 的 枚 
举 值 
NAME ОИ 
树 节 点 类 型 的 枚 举 值 

. 树 节 点 类 型 名 称 的 字符 串 数组 

TREE CODE CLASS | 类 型 const char *const ігее code class strings[] 以 TREE CODE 为 索引 的 树 节 
const enum tree code class tree сойе typel[] 点 类 型 数组 


const unsigned char tree_code length[] 树 节 点 操作 数 的 数目 


TREE CODE 标识 enum tree_code 





enum ігее сое class 





ЕЯ 操作 数 长 


度 (数目 ) 


43 树 节点 结构 


4.2 节 对 每 一 个 树 节点 的 声明 进行 了 详细 的 描述 ， 从 树 节点 的 类 型 及 标识 的 讨论 等 可 以 看 出 ， 树 节点 种 类 很 多 ， 那 么 如 此 多 的 树 节点 是 如 何 存储 的 呢 ? 








很 显然 ， 针 对 每 一 种 节点 均 设 计 一 个 专门 的 数据 结构 会 产生 大 量 的 数据 结构 ， 并 且 带 来 代码 阅读 和 维护 上 的 巨大 开销 ， 因 此 在 GCC 中 ， 所 有 树 节点 的 存储 都 使 用 union 类 型 ， 即 联合 体 ， 用 来 描述 纷繁 
复杂 的 树 节点 内 容 。 在 gcc/tree.h 中 定义 的 union tree_node 的 联合 体 如 下 : 














union tree node 
{ 

struct tree base base; 

struct tree common common; 

struct tree int cst int cst; 

struct tree real cst real cst; 

struct tree fixed cst fixed cst; 
struct tree vector vector; | 
struct tree_string string; 
struct tree_complex complex; 
struct tree identifier identifier; 
struct tree decl minimal decl minimal; 
struct tree decl соттоп десі соттоп; 
struct tree decl with гё] десі with rtl; 
struct tree decl поп common decl поп common; 
struct tree parm десі parm decl; 
struct tree decl with vis decl with vis; 
struct tree var decl var десі; 
struct tree field десі field decl; 
struct tree label десі 1аре1 десі; 
struct tree result decl result decl; 
struct tree const десі const десі; 
struct tree type десі type десі; 
struct tree function decl function decl; 
struct tree type type; 
struct tree list list; 
struct tree vec vec; 
struct tree exp exp; 
struct tree ssa name ssa name; 
struct tree block block; 
struct tree binfo binfo; 
struct tree statement list stmt list; 
struct tree constructor constructor; 
struct tree memory tag mtag; 
struct tree omp clause отр clause; 
struct tree_memory_partition tag mpt; 
struct tree_optimization_option optimization; 
struct tree_target_option target_option; 














可 以 看 出 ，tree_node 联 合体 为 所 有 的 树 节点 提供 了 一 个 统一 的 存储 访问 界面 ，struct tree base, struct tree common, struct tree_int_ cst、struct tree_real_cst 等 结构 体 成 员 分 别 用 来 存储 各 种 各 
样 的 树 节点 ， 而 union tree_node 联 合体 只 是 这 些 不 同 结构 体 的 一 个 通用 的 名 称 而 已 。 表 4-2 给 出 了 这 些 不 同 的 结构 体 所 存储 树 节点 的 基本 描述 ，union tree_node 就 是 这 些 所 有 的 存储 结构 体 的 一 个 泛称 。 





























表 4-2 union tree_node 中 结构 体 成 员 的 意义 


联合 体 中 的 结构 体 字段 
struct tree_base base 
struct tree_common common 


struct tree_int cst int _cst 

struct tree геа! cst real cst 

struct tree_fixed_cst fixed cst 

struct tree_string string 

struct tree_complex complex 

struct tree уесіог vector 

struct tree_identifier identifier 

struct tree_decl minimal decl minimal 
struct tree_decl common decl common 


struct tree_decl_with_rtl decl_with_rtl 
struct tree_decl поп соттоп decl поп соттоп 





struct tree рагт десі рагт decl 
struct тее (есі with vis decl with vis 





struct tree_var десі var_decl 

struct ігее field десі field десі 

struct tree label decl label десі 

struct tree_result_decl result есі 
struct ігее сопѕі decl const decl 
struct tree_type_decl type_decl 

struct tree_function decl function decl 


联合 体 中 的 结构 体 字段 
struct tree_type type 
struct tree_list list 
struct tree_vec vec 
struct tree_exp exp 
struct tree_ssa_name ssa пате 


struct tree_block block 

struct tree_binfo binfo 

struct tree_statement list stmt list 

struct tree_constructor constructor 

struct tree memory tag mtag 

struct tree отр clause omp_clause 

struct tree memory_partition tag трі 

struct tree_optimization option optimization 
struct tree_target_option target_option 


下 面 几 个 小 节 分 别 介绍 union tree_node 中 各 个 结构 体 成 员 的 详细 内 容 。 


44 AsT 输 出 及 图 示 





& Ж 
树 节 点 的 基 类 只 作为 构成 其 他 具体 
树 节点 的 共有 基本 信息 树 节点 的 一 部 分 出 现 

ІН 


整 型 常量 节 
实数 常量 节点 
定点 数 常量 节 ， 
字符 申 常量 节 ， 
复数 常量 节点 
向 量 常量 节点 
标识 符 节 点 
声明 的 基 类 
声明 的 基 类 


AN 





具有 rtl 属性 的 声明 
非 一 般 声明 的 基 类 


参数 声明 节点 


有 具有 可 见 性 声明 的 基 类 


变量 声明 
字段 声明 
标签 声明 节点 


返回 值 声明 节 ， 


类 型 声明 节点 





类 型 节点 


各 种 声明 节点 


表达 式 节 点 


静态 单 赋值 SSA_NAME 节点 


块 信息 节点 


语句 列表 节点 


其 他 

















GCC 提供 了 -fdump-tree-original、-fdump-tree-all 等 选项 ， 可 以 输出 GCC 处 理 源 代 码 过 程 中 的 AST 及 GIM PLE 中 间 表 示 信 息 。 例 如 使 用 -fudmp-tree-original 就 可 以 输出 GCC 进行 词法 /语法 解析 后 
所 生成 的 AsT 信 息 ， 然 而 该 AST 信 息 过 于 繁杂 ， 不 便 分 析 ， 因 此 ， 本 节 通 过 在 GCC 源 代码 中 增加 一 些 调试 语句 ， 从 而 输出 AsT 信 息 。 























在 gcc/gimplify.c 的 gimplify function_tree 函 数 中 添加 如 下 语句 ， 主 要 调用 dump_node 函 数 打印 当前 函数 的 AST 节 点 ， 此 时 打印 的 节点 信息 是 在 AST 转 换 为 GIMPLE 之 前 的 内 容 。 








void 
gimplify function tree (tree Епдесі) 


tree oldfn, parm, гей; 
gimple seq seq; 

gimple bind; 

int 1; 

/* 以 下 为 增加 的 代码 */ 
FILE *fp; 

char filename[128]; 


sprintf (filename, "А5Т-%5", current function name ()); 
/* 保存 AST 信 息 的 文件 名 称 为 AST-${function папе} */ 


fp = fopen (filename, "w"); 
dump_node (fndecl, 0x1FFF8, fp); 
fclose (fp); 


/* 0x1FFF8 为 打印 标志 ， 不 同 的 标 





志 会 导致 输出 结果 的 差异 */ 











编译 该 GCC 源 代码 ， 并 使 
称 为 AsT-main 等 。 








例 4-18 打印 函数 的 AsT 信 息 


假设 有 如 下 的 源 代码 : 





编译 出 来 的 cc1 来 编译 下 面 例子 中 的 源 代码 ， 从 而 生成 其 中 各 个 函数 对 应 的 AST 信 息 ， 例 如 函数 func 对 应 的 AsT 信 息 文件 名 称 为 AsT-func，main 函 数 对 应 的 AsT 信 息 文 件 名 





[GCCQlocalhost test]$ cat test.c 
int main(int argc, char *argv[]){ 
int i=0; 
int sum=0; 
for (i=0; 1<10; i++){ 
sum = Sum + i; 
} 
return sum; 


} 





编译 该 源 代码 : 





[GCC@localhost test]$ ~/paag-gcc/host-i686-pc-linux-gnu/gcc/ccl test.c 





该 源 代码 中 函数 main 对 应 的 AST 文 件 名 称 为 AST-main， 查 看 该 文件 。 





[GCC@localhost ast-node]$ сас AST-main 


81 function decl name: @2 type: 
link: 
@2 identifier_node lngt: 
@3 function type algn: 
@4 parm decl type: 
size 





: b7cffle0 


85 bind expr 812 





86 іпіедег cst 815 
87 integer type 816 
5 signed 
818 
88 tree list : 87 
89 identifier_node : argc 
810 рата decl | 820 
821 
811 
811 integer cst @15 
812 void type 822 
813 хак десі 823 
824 
: 825 size 
: b7d91000 
814 statement list : 026 1 
Е 830 5 
834 9 
815 іпседег _ type 837 size: 
unsigned min 
840 addr 
0816 суре decl : @41 type: 
: b7d06680 
817 integer cst 87 high: 
= Ь7с4763с 
818 integer cst 87 
819 tree list : @21 
820 identifier_node argv 
821 pointer_type 811 
822 type decl 844 
Ь7410000 
823 igdentifier поде i 
824 var decl С 845 
825 
: @11 
825 integer cst : @7 
@26 decl expr 812 
827 десі expr 812 
828 modify expr : @7 
829 goto expr : @12 
830 label expr : 012 
831 modify expr : @7 
832 postincrement ехрг type: 87 
833 label expr 一 : 812 
834 сопа ехрг : 812 
= : 07953190 
835 label ехрг 812 name: 
836 return expr 812 expr: 
837 igentifier node bit size type 
@38 integer cst @15 
@39 integer cst 815 
840 integer cst : 615 
841 igdentifier node 7 ipt 
842 tree list 812 
843 pointer type @11 
844 identifier поде void 
0845 identifier node : sum 
846 label десі : 812 scpe: 
: artificial 
847 label десі 012 scpe: 
: artificial 
848 plus expr : @7 ор 0: 
849 integer cst : @7 low : 
850 le expr 87 ор 
851 goto expr : @12 labl: 
852 goto expr : 0812 labl: 
853 label десі 812 всре: 
artificial 
854 modify expr : @7 op 0: 
855 integer type : 858 size; 
Е signed тїп: 
860 addr 
856 integer _ cst 87 low 
@57 result decl : @7 scpe: 
: artificial 





2 32 адаг: 





ге 

















83 вүср: test.c:1 
extern body: 05 addr: 
4 addr: b7d6e930 
8 retn: 87 prms: 
87 всре: 081 ѕгср: 
: 11 а19п: 32 used: 
: 0813 body: 0814 addr: 
8 addr: b7cf7508 
811 а1ап: 32 ргес: 
817 
b7d062d8 
: 819 addr: b7d908c0 
:4 addr: b7d8ac08 
: 821 scpe: 081 ѕгср: 
232 used: 0 addr: 
32 addr: b7cf7690 
8 addr: b7d0d270 
5287 всре: 081 ѕгср: 
£ 11 а1ап: 32 used: 
: @27 2 : 828 3 
631 6 : 832 7 
35 10 : 836 ааа: 
@38 а1ап: 64 ргес: 
839 
7906068 
87 srcp: <built-in>:0 
过 low : -2147483648 
: 2147483647 addr: b7cf7658 
: 042 addr: b7d908a4 
:4 addr: b7d8ac40 
: 392 ptd : 843 адаг: 
: 812 srcp: <built-in>:0 
I addr: b7d8acb0 
: 87 scpe: 081 srcp: 
: 32 used: 1 адаг: 
214) addr: Ы7сЁ7ссс 
b7d044e0 
b7d04500 
: 613 ор 1: 025 addr: 
: @46 addr: 57404580 
: 847 addr: b7d04520 
@24 op 1: @48 addr: 
813 ор 1: 049 адаг: 
: @46 addr: 57404560 
: 850 ор 1: 051 ор 2: 
6853 addr: 574045с0 
854 addr: b7d045e0 
ingt: 13 addr: 
: 64 addr: b7cf778c 
0 addr: Б7сҒ7с08 
5 low : -1 addr: 
2 9 addr: 57405348 
Ь7с#7#с0О 
32 ptd : @55 addr: 
4 addr: b7d05658 
2.3 addr: b7d8ace8 
81 вүср: test.c:6 
addr: b7cff320 
81 ѕгср: test.c:6 
addr: b7cff2d0 
824 ор 1: 013 addr: 
1 addr: b7cf7ce8 
813 ор 1: 056 addr: 
847 addr: 57404540 
853 addr: b7d045a0 
681 srcp: test.c:6 
addr: b7cff370 
857 ор 1: 0824 addr: 
86 algn: 8 Prec: 
859 
b7d061a0 
9 addr: b7d909bc 
81 ѕгср: test.c:1 
size: 6811 
b7cff280 





Ь7486700 
88 
ъеѕі.с:1 
0 
b7d531b8 
32 


Тезі.с:1 


Ь7сҒЕ230 


test.c:2 


1 


: 829 


833 
Ь7490930 
36 


7085618 


test.c:3 


b7d91058 


b7cfe5e8 


b7cfe678 


b7cfe630 


852 


Ь74а059а0 


b7cf7bd0 


b7d0faf8 


b7cfe654 


b7cfe60c 


b7cfe69c 
8 


858 суре десі папе: 861 type: 655 srcp: <built-in>:0 
addr: b7d066e8 


859 integer cst type: 055 high: -1 low : -128 addr: b7cf74d0 
860 integer cst type: @55 low : 127 addr: b7cf7594 
861 identifier_ node strg: char lngt: 4 addr: b7d050a8 








可 以 看 出 ， 上 述 输出 的 AsT 信 息 阅读 起 来 还 是 比较 隐 涩 ， 读 者 很 难 把 握 这 些 节点 之 间 的 关系 。 当 源 代码 比较 多 时 ， 生 成 的 AST 节 点 更 为 复杂 ， 此 时 AsT 文 件 的 阅读 更 加 困难 。 


























为 了 对 上 述 的 AST 信 息 进 行 有 效 分 析 ， 尤 其 是 各 个 AST 节 点 之 间 的 相互 关系 ， 可 以 使 用 http://www.graphviz.org 提 供 的 图 形 可 视 化 工具 Graphviz (Graph Visualization Software) 对 上 述 的 AST 信 息 
进行 图 示 ， 从 而 直观 地 进行 AST 分 析 。 
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在 进行 图 示 前 ， 需 要 对 上 述 的 AsT 信 息 进行 处 理 ， 分 析 节 点 之 间 的 关系 ， 并 转换 成 给 
关系 图 等 均 是 采用 graphviz 中 的 dot 工 具 绘制 。 














脚本 ， 最 后 调用 graphviz 提 供 的 绘图 工具 绘制 出 这 些 节点 之 间 的 关系 ， 例 如 本 书 中 所 有 的 AST 节 点 图 以 及 函数 调 







































































下 面 给 出 使 用 shell 工 具 对 AST 信 息 进行 提取 ， 并 进行 图 形 绘制 的 shell 脚 本 。 其 主要 包括 以 下 几 个 步骤 : 














(1) pre.awk: 使 用 awk 脚本 对 AST 文 件 信息 进行 预 处 理 。 





[GCC@1localhost ast-node]$ cat pre.awk 
#! /usr/bin/gawk -f 


wel 
азор (/^0/, "~@", 50); 
gsub(/( *):( *)/, ":", 50); 
print; 








(2) treeviz.awk: 使 用 awk 脚本 将 预 处 理 后 的 AST 信 息 转 换 成 图 形 脚本 。 








[ 








[GCC@localhost ast-node]$ сас treeviz .awk 
#! /usr/bin/gawk -f 
#http://alohakun.blog7.fc2.com/?mode=m&no=355 


BEGIN {RS = "~@"; printf "digraph G {\n node [shape = record];\n";} 
/^10-91/{ 
5 = sprintf("%s [label = \"{%s: %5 | {", 51, 51, 52); 
for(i = 3; і < NF; i++) 
5 = в sprintf("%s | ",51); 
s = в sprintf("%s}}\"];\n", $i); 
50 = в; 


while (/ (10-9а-2А-7]+) :@ ([0-9]+) /) { 

format = sprintf("<\\1>\\1 \\3\n %з:\\1 -> \\2;", 61); 

50 = gensub (/ ([0-9а-2А-2]+) :@ ([0-9]+) (.%)5/, format, "9"); 
1; 
printf " з\п", 50; 


} 
END {print "}"} 


























(3) ast to_dot.sh: 调用 上 述 两 个 awk 处 理 脚 本 ， 并 最 终 调 用 dot 等 绘图 工具 生成 AST 图 形 


























[GCC@localhost ast-node]$ cat ast to dot.sh 

#/bin/bash 

% $1 为 AST 文 件 名 称 

# $2 可 以 是 字符 事 “all” 表 示 图 示 AST 中 的 所 有 节点 

! ды РОИ ВАЗА 则 该 脚本 只 图 示 指 定编 号 的 RST 节 点 
例如 : 

# ./аве to dot.sh AST file all 表示 图 示 所 有 节点 及 其 相关 关系 

# ./ast to dot.sh RST file 1 4 5 8 表示 图 示 RST 文 件 中 编号 为 1、4、5、8 等 几 个 节点 的 信息 及 其 关系 

# САТЕ 

f=$1 

# 对 AST 文 件 中 一 些 特殊 字段 进行 处 理 ， 将 不 必要 的 空格 去 挤 

sed -i "s/op\ 1/opl/g" $f 

sed -i "s/op\ 2/0р2/9" $f 

sed -i "s/op\ 0/ор0/а" $f 

# 对 RST 文 件 进行 预 处 理 ， 为 了 清晰 起 见 ， 可 以 将 一 些 “ 次 要 的 ”信息 删除 ， 减 少 图 形 中 的 信息 ， 用 户 可 以 根据 需要 修改 

./рге.аяК $f | sed 's/srcp:[a-z .:0-9<>-| %// 9' | sed 's/note: [a-z] *// g' | sed 's/link: [a-z] *// 4! | sed 'ѕ/иѕеа: [0-9] *// g' | sed 's/algn: [0-9] *// g' |sed "в/ргес: [0-9] 

# 对 简化 后 的 AST 文 件 进行 转换 ， 生 成 图 形 脚 本 文件 $f.dot 

./treeviz.awk tmpl > $f.dot 

# 创建 临时 文件 

rm -f tmp; touch tmp 

% 如 果 $2 表 示 全 部 转换 ， 则 直接 使 用 上 述 转 换 后 的 dot 脚 本 ， 和 否则 ， 从 上 述 生成 的 dot 脚 本 中 筛选 相应 的 节点 ， 加 入 到 tmp 文 件 中 





if [ $2 != "all" 1 

then 
echo "digraph G {" >> tmp 
echo " node [shape = record];" >> tmp 
shift 


rm -rf tmp header 
# 筛选 给 定 的 节点 
for n in $* 
ао 
grep " $n " $f.dot >> tmp 
grep " ӛп:" $f.dot >> tmp_header 
done Е 
rm -rf tmp һеадег tail 
for п іп 5% Е 
ао 
grep " $п;" tmp header >> tmp header tail 
done ш т Е 
E 去 除 宛 余 的 节点 信息 
sort tmp header tail | uniq >> tmp 
echo " }" >> tmp 
# 否则 图 示 所 有 节点 
else 
cat $f.dot > tmp 
fi 
# 调 用 graphviz 中 的 Got 工具 绘图 ， 节 点 字体 大 小 为 10point， 输 出 文件 格式 为 svg 和 失 量 图 形 格式 ， 输 出 文件 名 称 为 $E.svg 
dot -Nfontsize=10 -Tsvg tmp -o $f.svg 





ast_to_dot.sh 脚 本 有 两 种 典型 的 执行 方式 : 











(1) 对 AST 文 件 中 的 所 有 内 容 进行 处 理 并 绘图 ， 生 成 的 图 形 文件 名 称 为 AST_FILE.svg。 





[GCC@localhost test]$ ./ast to дої AST FILE all 








(2) 对 AST 文 件 中 的 编号 为 @node_num1，@node_num2，.… 等 节点 的 内 容 进行 处 理 并 绘 | 


Ий] 








， 生 成 的 图 形 文件 名 称 为 $AST_FILE.svg。 











[GCC@localhost test]$ ./ast to dot AST FILE node поті, node num2, Ò: 









































|! 


在 某 些 情况 下 ， 读 者 只 关注 某 个 节点 及 其 相关 节点 之 间 的 关系 ， 而 忽略 其 他 节点 的 信息 ， 此 时 可 以 使 用 如 下 的 脚本 ， 用 来 图 示 某 个 节点 及 其 相关 节点 (一 般 只 打印 到 其 两 层 子 节点 ) ， 该 脚本 名 称 为 
print_node.sh， 内 容 如 下 : 

















[6СС@1оса1ћоѕі ast-node]$ cat print node.sh 
#/bin/bash 

% $1 AST 文 件 名 称 

% $2 节点 编号 


% $3 打印 方向 ， 取 值 为 LRIRL|BT， 分 别 表示 按 从 left-to-right，right-to-left,bottom-to-top 的 方向 画图 ， 省 略 则 表示 从 top-to-bottom 


# 例如 : ./print node.sh AST-FILE 5 LR 表示 图 示 @5 号 节点 及 其 相关 联 的 节点 ， 图 示 的 方向 为 从 左 到 右 
# 获取 AST 文 件 名 称 
f=$1 
% 获取 给 定 的 节点 编号 
node=$2 
# 获取 绘图 方向 
rank=$3 
# 对 RST 文 件 中 一 些 特殊 字段 进行 处 理 ， 将 不 必要 的 空格 去 掉 
sed -i "s/op\ 1/ор1/а" $f 
sed -i "s/op\ 2/ор2/а" $f 
sed -i "s/op\ 0/op0/g" $f 
# 对 RST 文 件 进行 预 处 理 ， 为 了 清晰 起 见 ， 将 一 些 “ 次 要 的 ”信息 删除 ， 减 少 图 形 中 的 信息 
./pre.awk $f | sed 's/srcp:[a-z_.:0-9<>-] *// 9' | sed 's/note: [a-z] %// 9' > tmpl 
# 将 预 处 理 后 的 文件 进行 dot 脚 本 的 转换 
./treeviz.awk tmpl > $f.dot 
rm -f tmp; touch tmp 
# 生成 dot 脚 本 的 首部 
echo "digraph G {" >> tmp 
echo " node [shape = гесога];" >> tmp 
rm -rf tmp header 
+ 得 选 与 hode 节 点 有 关 的 关联 关系 
grep " $node " $f.dot >> tmp 
grep " $node:" $f.dot >> tmp header 
# 查找 以 node 为 起 始 节点 的 关联 关系 
tail=`grep " $node:" $f.dot | awk '{print $3}' | sed '5/;// 9'` 
# 将 node 关 联 的 子 节点 
for n in $tail 
do 

grep " $n " $f.dot >> tmp 

grep " $п:" $f.dot >> tmp header 
done 
[ -f tmp_header ] && sort tmp_header | uniq >> tmp 
# 生成 dot 脚 本 的 结束 部 分 
echo " }" >> tmp 
# 根据 方向 参数 ， 调 用 graphviz 中 的 dot 工 具 绘 图 








if | -z $rank 1 
then 
dot -Nfontsize=10 -Tsvg tmp -o ${f}_${node}.svg 
else 
dot -Nfontsize=10 -Grankdir=${rank} -Tsvg tmp -o ${f}_${node}.svg 
fi. 





例如 ， 如 果 执 行 下 述 命令 : 





[GCC@localhost ast-node]$ ./ргіпі поде А5Т-паіп 1 ІК 

















就 可 以 根据 例 4-18 中 的 AsT 信 息 ， 将 @1 号 节点 及 其 关联 的 节点 输出 为 图 4-22 所 示 的 内 容 ， 其 中 的 打印 方向 为 从 左 向 右 (LR，Left-to-Right) 。 从 中 可 以 清晰 地 看 出 函数 声明 节点 (©0155. 











符 节点 (@2 号 节点 ) 、 函 数 类 型 节点 (@3 号 节点 ) 、 参 数 声明 节点 (@4 号 节点 ) 以 及 BIND_EXPR 表 达 式 节点 (@5 号 节点 ) 之 间 的 关系 。 




















通过 使 用 上 述 的 脚本 ， 用 户 可 以 很 方便 地 显示 AsT 中 的 部 分 节点 及 其 相互 关系 ， 或 者 某 个 节点 所 关联 的 其 他 节点 ， 有 了 AsT 的 

















例 4-19 图 示 AST 中 的 部 分 信息 














有 了 上 述 ASTI 


IR] 


示 的 脚本 ， 就 可 以 对 例 4-18 中 的 AST 进 行 图 形 化 显示 。 例 如 ， 当 读者 对 函数 声明 感 兴趣 时 ， 可 以 使 用 : 























图 示 ， 对 了 





理解 AsT 非 常 有 帮助 。 


点 ) 与 标识 





[GCC@localhost ast-node]$ ./ргіпі поде А5Т-паіп 1 ІК 








打印 出 该 节点 所 关联 的 节点 ， 如 图 4-22 所 示 。 
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4-22 dot 绘图 示例 


当 读 者 对 main 函 数 中 的 BIND_EXPR 节 点 感 兴趣 时 ， 可 以 使 用 : 
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чә 


人 





[GCC@localhost ast-node]$ ./print node AST-main 5 IR 





打印 该 信息 ， 其 中 的 5 表示 BIND_EXPR 节 点 的 节点 编号 ， 结 果 如 图 4-23 所 示 。 




































































点 及 其 关系 绘制 出 来 ， 但 是 当 节 点 很 多 时 ， 图 中 的 节点 和 连接 关系 就 非常 复杂 ， 反 倒 失去 了 图 示 的 优势 ， 所 有 ， 当 AsT 中 节点 较 少时 ， 可 以 使 用 ./ast_to_dot.sh all 打 印 完整 的 As 























图 














中 读者 比较 感 兴趣 的 节点 ， 此 时 可 以 通过 给 定 ./ast_to_dot.sh 传 递 合适 的 节点 编号 ， 也 可 以 通过 ./print_node.sh 对 指定 的 节点 进行 图 示 。 





4.5 AST 的 生成 




















前 面 的 章节 讨论 了 AsT 中 树 节点 的 声明 和 存储 ， 并 给 出 了 具体 的 实例 ， 感 兴趣 的 读者 一 直 都 在 想 这 样 的 一 个 问题 : AsT 是 如 何 生成 的 呢 ? 这 就 是 本 节 的 主要 内 容 。 


























， 更 多 的 情况 是 打印 


在 使 用 图 示 工 具 的 时 候 ， 需 要 对 需要 图 示 的 内 容 进行 筛选 ， 否 则 可 能 导致 图 形 过 大 、 关 系 过 于 复杂 而 大 大 影响 节点 关系 的 分 析 。 例 如 ， 通 常 读 者 可 以 直接 使 用 ./ast_to_dot.sh АЅТ-таіп all 将 所 有 的 节 








图 








N 
N 


12: void_type | name 


N 


一 一 


pe 
Т | scpe 
5: bind ехрг 12: уаг йесі 
body 24 


N 









26 


һә № 


N 


95) 
© 


14: statement list 


чө 


(9 


29 























34 


35 


4-25 BIND_EXPR 节 点 
总 体 来 说 ，AST 是 源 代码 在 GCC 系统 中 的 一 种 中 间 表 示 形 式 ， 该 中 间 形 式 是 通过 GCC 前 端的 词法 /语法 分 析 所 构造 的 。 下 面 以 C 语 言 为 例 ， 分 别 介绍 GCC 前 端 词法 /语法 分 析 的 基本 过 程 。 对 词法 /语法 分 
析 的 基本 原理 感 兴趣 的 读者 可 以 阅读 相关 的 参考 文献。 
4.6 小 结 
本 章 主 要 描述 了 AST 的 结构 及 其 生成 的 主要 过 程 ， 主 要 涉及 AST 的 存储 结构 、 词 法 分 析 、 语 法 分 析 过 程 等 。 在 语法 分 析 完 成 后 ， 还 需要 进一步 进行 语义 分 析 等 过 程 ， 本 章 不 再 歼 述 。 
第 5 章 
GCC 通过 前 端 





从 AST/GENERIC 到 GIMPLE 
的 词法 /语法 分 析 后 ， 将 高 级 编程 语言 转换 成 抽象 的 AST 中 间 表 示 
GIMPLE。 本 章 主要 讨论 GIMPLE 的 














。 从 本 章 开始 ， 为 了 对 各 种 语言 的 AST 中 间 表 示 进 行 语言 无 关 的 处 理 和 优化 ，GCC3 引 入 了 另外 一 种 中 间 表 示 ， 即 
GIMPLE 的 表示 及 存储 ， 以 及 从 AST 到 GIMPLE 的 转换 过 程 等 内 容 。 
5.1 GIMPLE 
前 一 章 的 内 容 3 





由 于 各 种 语言 的 词法 /语法 处 理 形式 各 不 相同 ， 
的 。 














要 对 AsT 中 的 树 节点 进行 了 详尽 的 描述 ， 包 括 树 节点 的 类 型 及 其 存储 结构 ， 以 及 通过 词法 分 析 、 语 法 分 析 、 语 义 分 析 等 过 程 描述 了 GCC 中 抽象 语法 树 (AST) 的 生成 过 程 。 可 以 看 
定义 的 AsT 也 可 能 各 不 相同 ， 即 对 了 
那么 ，GENERIC 是 什么 呢 ? {88 

















每 一 种 前 端的 编程 语言 可 能 就 有 一 种 相应 的 AST 结 构 ， 而 
的 讲 ，GENERIC 就 是 规范 的 AST。 一 般 来 阅 ， 如 果 一 种 
出 ，GENERIC 是 一 种 规范 的 AST 表 示 形 式 ， 引 入 GENERIC 的 目的 就 是 力求 寻找 一 种 与 前 
GENERIC 合 起 来 称 为 AsST/GENERIC。 实 际 上 ， 在 GCC 中 ， 很 多 语 


为 了 处 理 不 同 的 














这 些 AST 中 树 节点 的 种 类 和 组 织 方式 也 有 可 能 是 不 尽 相同 
前 端 语言 的 AST 树 均 可 以 使 用 gcc/tree.h 中 所 表示 
端 语言 无 关 的 AST 统 一 表示 ， 便 了 


前 端 语言 








H 
П, 








=] 


така 




















对 各 种 语言 


= 


及 其 相应 的 AsT/GENERIC，GCC 引 入 了 一 种 与 前 
便于 GCC 在 GIMPLE 的 基础 上 进行 统一 的 中 间 处 理 和 系统 优化 。 

















无 关 的 中 间 表 示 











的 树 节点 表示 ， 那 么 该 AST 就 是 GENERIC AST。 可 以 看 
的 AsT 进 行 一 种 通 上 
的 前 端 处 理 并 不 包含 AsT 到 GENERIC 的 转换 ， 而 是 直接 将 AsT 转 换 成 与 语言 无 关 的 另外 一 种 中 间 表 示 ， 即 GIMPLE。 
端 语言 


的 处 理 而 已 。 从 这 个 角度 上 ， 本 书 把 AST 和 




















AST/GENERIC 表 达 式 转换 而 来 ， 它 们 之 间 最 3 
(1) AST 形 式 与 前 


变化 形式 。GIMPLE 与 SIM PLE 非 常 接近 ， 但 二 者 又 有 所 不 同 ， 例 如 SIMPLE 不 支持 goto 语 句 ， 但 GIMPLE 支 持 。 
GIMPLE 中 间 形 式 
言 的 前 端 


GIMPLE。 每 种 语言 的 前 端 处 理 系 统 都 应 该 将 该 语言 对 应 的 AST/GENERIC 转 换 成 GIMPLE， 从 而 
GIMPLE 这 个 词语 很 奇怪 ， 笔 者 认为 GIMPLE 可 以 理解 为 G6NU SIMPLE 或 者 GCC SIMPLE。GIMPLE 是 一 种 三 地 址 码 的 中 间 表 示 形 式 ， 是 McGill University McCAT 编 译 工 程 中 SIMPLE 中 间 语 言 的 一 种 











要 的 








区 别 包 括 : 
端的 编程 语言 是 相关 的 ， 每 种 


前 端 语 言 








依然 使 











司法 语法 分 析 后 形成 的 AsT 是 异 构 的 ， 缺 乏 一 种 规范 的 、 适 合 3 























处 理 均 应 按照 GIMPLE 的 规范 ， 将 该 语言 前 端 生 成 的 AST/GENERIC 形 式 转换 成 GIMPLE 形 式 ， 从 而 提供 给 GCC 进 行 后 续 语言 无 关 的 外 





各 种 语言 的 通用 表示 方法 。 而 GIMPLE 中 间 表 示 形 式 则 是 语言 无 关 的 ， 任 何 语 
言 НЕ, 
AST/GENERIC 是 树 形 结构 ， 而 GIMPLE 形 式 从 本 质 上 讲 是 线性 的 中 间 表 示 序 列 ， 可 以 更 方便 、 更 有 效 地 进行 后 续 的 编译 优化 。 需 
了 大 量 的 树 节点 ， 这 些 节 点 往往 作为 GIMPLE 语 句 的 操作 数 等 元 素 出 现 。 
(3) AST/GENERIC 的 属性 节点 类 型 非常 多 ， 而 GIMPLE 语 句 的 类 型 相对 较 少 
从 AST 及 GIMPLE 的 形式 上 来 说 ， 二 者 之 间 的 3 

















区 别 是 : 





注意 的 是 ， 虽 然 GIMPLE 是 线性 序列 ， 但 在 GIMPLE 的 表示 中 ， 




















(1) 在 GIMPLE 中 通过 引入 临时 变量 保存 中 间 结 果 ， 将 AsT 表 达 式 拆 分 成 不 超过 三 个 操作 数 的 元 组 (Tuples) 。 
(2) AST 中 的 控制 结构 ， 例 如 if-else、for、while 等 在 GIMPLE 表 示 中 都 被 转换 成 条 件 跳 转 语句 。 
(3) AsT 中 的 词法 作 


域 (Lexical Scopes) 在 低级 GIMPLE 中 被 取消 。 
(4) AST 中 的 异常 区 域 (Exceptional Region) 被 转换 成 一 个 香 





和 独 的 异常 





区 域 树 (Exception Region Tree) 。 


在 从 AST 向 GIMPLE 转 换 的 过 程 中 ，GIMPLE 的 生成 先后 经 历 了 两 个 阶段 ， 分 别称 为 高 级 GIMPLE (High-Level СІМРІЕ) 和 低级 GIMPLE (Low-Level СІМРІЕ) 。 在 执行 GIMPLE 处 理 过 程 (GCC 中 称 
为 Pass， 参 见 6.1 节 ) pass_lower_cf (参见 6.2 节 ) 之 前 ，GIMPLE 的 形式 为 高 级 GIMPLE， 执 行 了 该 处 理 过 程 之 后 ，GIMPLE 就 被 完全 转换 成 低级 GIMPLE。 高 级 GIMPLE 中 包含 了 一 些 例如 GIMPLE_BIND 
血 表 示 作 用 域 的 语句 ， 还 有 一 些 例如 GIMPLE_TRY 等 嵌 套 的 表达 式 等 ;低级 GIMPLE 中 就 不 存在 GIMPLE_BIND、GIMPLE_TRY 这 些 语句 了 。 详 细 信 息 可 以 参见 GCC internals, 


























下 面 通过 一 个 例子 来 描述 AST/GENERIC 以 及 GIMPLE 的 各 种 形式 ， 让 读者 先 有 一 个 直观 的 认识 。 
例 5-1 AST/GENERIC 及 GIMPLE 表 示 


假设 有 如 下 源 代码 test.c: 


[GCC@localhost test]$ сас test.c 
int main(int argc, char *argv[]){ 
int i=0; 
int sum=0; 
for (i=0; 1<10; i++){ 
sum = sum + і; 
} 
return sum; 


} 








首先 查看 其 经 过 词法 /语法 分 析 后 所 生成 的 AsT 信 息 : 


[GCC@localhost test]$ сас AST-main 


81 function десі name: 82 type: 83 згср: test.c:1 
к args: @4 link: extern Боду: @5 
82 identifier поде strg: main lngt: 4 
@3 function type size: 86 алай: 32 retn: 87 prms: 088 
84 parm десі папе: 089 type: 87 всре: @1 вгср: test.c:1 
т сһап: @10 argt: 87 size: @6 algn: 32 
used: 0 
@5 bind expr type: @11 vars: 0812 body: @13 
86 integer cst type: @14 low : 32 
@7 integer type name: @15 size: 86 algn: 32 prec: 32 
sign: signed min : @16 max : @17 
88 tree list valu: @7 chan: 018 
89 identifier node strg: argc lngt: 4 
8107 parm decl name: @19 type: @20 всре: 61 srop: test.c:1 
Ы агас: 820 
size: @6 а1ап: 32 used: 0 
811 void type name: @21 algn: 8 
@12 var decl name: @22 type: 07 scpe: @1 srcp: test.c:2 
chan: 0823 
init: @24 size: 86 algn: 32 used: 1 
813 statement list 0 : 825 ЕВ : 026 2 : 827 3 : @28 
Е 4 : 829 5 : 830 6 : 831 7 : 832 
8 : 833 9 : 834 10 : 8635 
814 integer type name: 836 size: 86 algn: 32 prec: 32 
T sign: unsigned min : @37 max : @38 
815 type decl name: 839 type: @7 srep: <built-in>:0 
816 integer cst type: @7 high: -1 low : -2147483648 
817 integer сз type: @7 low : 2147483647 
818 tree list valu: @20 chan: @40 
819 identifier node strg: argv lngt: 4 
820 pointer_type size: 06 algn: 32 ptd : @41 
821 type decl name: (842 type: @11 srcp: <built-in>:0 
0822 identifier node strg: і ingt: 1 
823 var decl ~ name: 843 type: 87 scpe: 61 ѕгср: test.c:3 
init: @24 
size: 086 algn: 32 used: 1 
@24 integer cst type: @7 low : 0 
825 decl expr type: @11 
826 decl_expr type: @11 
827 modify expr type: @7 ор 0: 0812 ор 1: 824 
828 goto ехрг type: @11 Тарі: @44 
829 label ехрг type: @11 папе: @45 
830 modify expr type: @7 op 0: @23 op 1: @46 
831 postincrement_expr type: @7 ор 0: 012 ор 1: 0847 
@32 label expr ` type: 011 name: @44 
833 сопа expr type: 0811 ор 0: 048 ор 1: 049 ор 2: 0850 
834 Јареї expr суре: @11 name: @51 
835 геіџгп ехрг type: @11 expr: 052 
836 identifier node strg: bit size буре lngt: 13 
837 іпіедег cst type: @14 “low: 0 
838 integer cst type: @14 low : -1 
839 identifier node strg: int иш; 3 
840 tree list valu: 6811 
841 pointer type size: 86 algn: 32 ptd : 853 
842 identifier node strg: void lngt: 4 
@43 identifier node strg: sum lngt: 3 
844 label decl type: @11 всре: 81 srcp: test.c:6 
note: artificial 
0845 label десі type: 6811 всре: 81 srcp: test.c:6 
note: artificial 
846 plus expr type: @7 ор 0: 023 ор 1: 612 
847 іпіедег cst type: 87 low : 1 
848 le ехрг type: 87 ор 0: @12 ор 1: 854 
849 goto ехрг type: @11 labl: 0845 
850 goto expr type: 811 labl: 051 
851 Јареї decl type: @11 scpe: 81 srcp: test.c:6 
note: artificial 
@52 modify expr type: @7 op 0: @55 op 1: @23 
853 integer_type name: 856 size: 857 algn: 8 prec: 8 
T sign: signed min : 058 max : @59 
854 integer cst type: @7 low : 9 
855 result десі суре: 87 всре: 081 згср: test.c:1 
Е note: artificial size: 86 algn: 32 
856 суре (есі name: 860 type: 053 srcp: <built-in>:0 
857 integer cst суре: @14 low : 8 
858 integer cst type: 653 highs -1 low : -128 
859 integer cst type: 853 low : 127 
@60 identifier_node strg: char lngt: 4 





对 应 的 高 级 GIMPLE 内 容 如 下 : 





[GCC@localhost test]$ сас GIMPLE-main 

<&0xb74d7534> [test.c : 81 gimple bind < 
<&0xb7470528> [test.c : 2] gimple assign <integer cst, iD.1192, 0, NULL> 
<&0xb7470564> [test.c : 3] gimple assign <integer cst, sumD.1193, 0, NULL> 
<&0xb74705a0> [test.c : 4] gimple assign <integer сз, iD.1192, 0, NULL> 
<80х574411е0> [test.c : 41 gimple goto <<D.1195>> | 
<&0xb74d1208> gimple label <<D.1194>> 
<&0xb74f1240> [test.c : 5] gimple assign <plus expr, sumD.1193, sumD.1193, iD.1192> 
<&0xb74f1280> [test.c : 41 gimple assign <plus expr, iD.1192, 1р.1192, 1> 
<&0xb74d1230> gimple label <<D.1195>> T 
<&0xb74f27e0> [test.c : 41 Чішріе сопа <le_expr, iD.1192, 9, <D.1194>, <D.1196>> 
<&0xb74d1258> дішріе 1аре1 <<D.1196>> 
<&0xb74705dc> [test.c : 71 gimple_assign <var_decl, D.1197, sumD.1193, NULL> 
<&0xb74f2818> [test.c : 7] gimple_return <D.1197> 


对 应 的 低级 GIMPLE 内 容 如 下 : 


[GCC&localhost test]$ сас GIMPLE-Lower-main 


<&0xb7470528> [test.c : 21 gimple assign <integer cst, iD.1192, 0, NULL> 
<&0xb7470564> [test.c : 3] gimple assign <integer cst, sumD.1193, 0, NULL> 
<&0xb74705a0> [test.c : 41 gimple assign <integer cst, iD.1192, 0, NULL> 
<80х574411е0> [test.c : 41 gimple goto <<D.1195>> | 


<&0xb74d1208> gimple label <<D.1194>> 


<&0xb74f1240> [test.c : 5] gimple assign <plus expr, sumD.1193, sumD.1193, iD.1192> 
<&0xb74f1280> [test.c : 4] gimple assign <plus expr, 10.1192, iD.1192, 1> 


<80х57441230> gimple label <<D.1195>> 


<&0xb74f27e0> [test.c : 4] gimple сопа <le expr, 10.1192, 9, <D.1194>, <D.1196>> 


<&0xb74d1258> gimple label <<р.1196>> 


<&0xb74705dc> [test.c : 7] gimple assign <var decl, D.1197, sumD.1193, NULL> 
<&0xb74d1280> [test.c : 7] gimple goto <<D.1199>> 


<&0хЬ74412а8> gimple label <<D.1199>> 
<&0хЬ74#2818> gimple return <D.1197> 





通过 对 比 上 述 两 种 GIMPLE 形 式 的 输出 ， 可 以 大 致 看 














GIMPLE 语句 类 型 
可 以 出 现在 高 

级 GIMPLE 和 低级 

GIMPLE 中 





HGIMPLE 的 一 些 特点 ， 以 及 高 级 GIMPLE 及 低级 GIMPLE 之 间 的 一 些 和 


GIMPLE ASM 
GIMPLE ASSIGN 
GIMPLE CALL 


GIMPLE CHANGE 
DYNAMIC TYPE 
GIMPLE SWITCH 
GIMPLE RETURN 
GIMPLE PHI 

GIMPLE RES 














表 5-1 GIMPIE 语 自 的 类 型 


СІМРІЕ СОТО 

СІМРІЕ LABEL 

СІМРІЕ МОР 
СІМРІЕ OMP FOR 
GIMPLE OMP MASTER 
GIMPLE OMP ORDERED 
GIMPLE OMP PARALLEL 
GIMPLE OMP RETURN 
GIMPLE ОМР SECTION 





区 别 。 表 5-1 给 出 了 各 种 GIMPLE 语 句 在 高 级 GIMPLE 和 低级 GIMPLE 中 的 


包含 的 GIMPLE 语句 (GIMPLE_CODE) 


GIMPLE OMP SECTIONS 


GIMPLE OMP ЅЕСТІОМЅ 


SWITCH 
GIMPLE OMP SINGLE 


GIMPLE OMP ATOMIC LOAD 
GIMPLE OMP ATOMIC STORE 


GIMPLE OMP CONTINUE 
GIMPLE OMP CRITICAL 


GIMPLE COND 


GIMPLE EH FILTER 
СІМРІЕ TRY 





只 出 现在 高 级 
GIMPLE 中 


GIMPLE САТСН GIMPLE BIND 


Ж: 参见 http://book.selboo.com.cn/gcc/GIMPLE-instruction-set.html#GIMPLE-instruction-set。 


下 面 的 章节 分 别 来 介绍 GIMPLE 中 间 表 示 中 GIMPLE 语 句 的 类 型 、GIMPLE 语 句 的 存储 结构 、GIMPLE 语 句 操作 数 的 获取 以 及 GIMPLE 的 生成 过 程 等 。 


5.2 ”GIMPLE 语 句 


Æ$ (GCC_SOURCE) /gcc/gimple.def 文 件 中 对 各 种 GIMPLE 语 句 进行 了 声明 。 该 声明 中 包括 了 GIMPLE 语 句 的 标识 (GIMPLE_CODE， 用 来 描述 该 GIMPLE 语 句 的 语义 ) 、 名 称 以 及 获取 该 GIMPLE 
语句 操作 数 的 偏 移 量 (该 偏 移 量 以 DEFGSCODE 宏 定义 中 使 用 的 结构 体 大 小 来 计算 ) 等 基本 信息 。 

















例 5-2 查看 GCC 中 GIMPLE 语 句 的 声明 





[GCC&localhost paag-gcc]$ grep ^DEFGSCODE gcc/gimple.def 

DEFGSCODE (GIMPLE ERROR MARK, "gimple error mark", NULL) 

DEFGSCODE (GIMPLE COND, "дішріе сопа", struct gimple statement with ops) 

DEFGSCODE (GIMPLE СОТО, "gimple добо", struct gimple statement with ops) 

DEFGSCODE (СІМРІЕ ТАВЕІ, "дішріе label", struct gimple statement with ops) 

DEFGSCODE (GIMPLE SWITCH, "дішріе switch", struct gimple statement with ops) 

DEFGSCODE (GIMPLE CHANGE DYNAMIC ТҮРЕ, "gimple сһапде dynamic type", struct gimple statement with ops) 
DEFGSCODE (GIMPLE ASSIGN, "gimple assign", struct дішріе statement with memory ops) Е Е 
DEFGSCODE (GIMPLE А5М, "gimple азш", struct gimple statement asm) 

DEFGSCODE (GIMPLE CALL, "дішріе call", struct gimple statement with memory ops) 

DEFGSCODE (GIMPLF, RETURN, "gimple return", struct gimple statement with memory орѕ) 

DEFGSCODE (GIMPLE BIND, "gimple ріпа", NULL) 
DEFGSCODE (СІМРІЕ САТСН, "gimple catch", NULL) 
DEFGSCODE (GIMPLE EH FILTER, "gimple eh filter", 
DEFGSCODE (СІМРІЕ PHI, "gimple phi", NULL) 
DEFGSCODE (GIMPLE RESX, "gimple resx", NULL) 
DEFGSCODE (СІМРІЕ TRY, "gimple try", NULL) 
DEFGSCODE (GIMPLE МОР, "gimple пор", NULL) 
DEFGSCODE (СІМРІЕ OMP АТОМІС LOAD, "gimple omp atomic load", NULL) 
DEFGSCODE (СІМРІЕ ОМР АТОМІС STORE, "дішріе omp atomic store", NULL) 
DEFGSCODE (GIMPLE OMP CONTINUE, "gimple omp continue", NULL) 
DEFGSCODE (GIMPLE OMP CRITICAL, "gimple отр critical", NULL) 

DEFGSCODE (GIMPLE_OMP_FOR, "gimple_omp_for", NULL) 
DEFGSCODE (GIMPLE OMP MASTER, "gimple опр master", NULL) 

DEFGSCODE (GIMPLE ОМР ORDERED, "gimple omp ordered", NULL) 
DEFGSCODE (GIMPLE OMP PARALLEL, "gimple omp parallel", NULL) 

DEFGSCODE (GIMPLE OMP TASK, "gimple omp task", NULL) 

DEFGSCODE (GIMPLE OMP RETURN, "gimple отр return", NULL) 
DEFGSCODE (GIMPLE OMP_SECTION, "gimple отр ѕесііоп", NULL) 

DEFGSCODE (GIMPLE ОМР ЗЕСТІОМЅ, "gimple отр sections", NULL) 

DEFGSCODE (GIMPLE OMP_SECTIONS SWITCH, “gimple отр sections switch", NULL) 
DEFGSCODE (GIMPLE OMP SINGLE, “gimple omp single", NULL) 

DEFGSCODE (GIMPLF, PREDICT, "gimple predict", NULL) 

DEFGSCODE (GIMPLE WITH CLEANUP EXPR, "gimple with cleanup expr", NULL) 


NULL) 





上 述 DEFGSCODE (GIMPLE symbol，printable name, structure) 定义 中 ，GIMPLE_symbol 是 该 GIMPLE 语 句 的 操作 类 型 码 ( 即 GIMPLE CODE) , printable name 表 示 该 GIMPLE 语 句 的 打印 名 
来 计算 该 GIMPLE 语 句 存储 结构 中 操作 数 的 偏 移 地址 。 例 如 : 








structure 





а 














DEFGSCODE (GIMPLE COND, "дішріе сопа", struct gimple statement with орз) 





声明 的 GIMPLE 语 句 信息 包括 : 





(1) 该 GIMPLE 语 句 为 条 件 语句 ， 其 GIMPLE_ CODE 为 GIMPLE_ СОМЫ; 


(2) 该 GIMPLE 语 句 的 打印 名 称 为 “gimple сопа" ; 








(3) 该 GIMPLE 语 句 存储 时 ， 使 用 的 结构 体 为 struct gimple_statement_with_ops， 通 过 该 结构 体 的 相关 信息 ， 可 以 计算 GIMPLE_COND 语 句 操 作 数 的 偏 移 量 ， 从 而 可 以 对 其 操作 数 进行 访问 。 





另外 ， 从 例 5-2 代 码 输 出 可 以 看 出 ， 在 GCC 4.4.0 中 定义 的 GIMPLE 语 句 共有 33 种 ， 其 类 型 码 (GIMPLE_CODE) 被 组 织 成 一 个 枚 举 类 型 enum gimple_code， 在 gcc/gimple.h 中 给 出 了 如 下 的 声明 : 





enum gimple code ( 
#define DEFGSCODE (SYM, STRING, STRUCT) SYM, 
#include "gimple.def" 
#undef DEFGSCODE 
LAST АМО UNUSED СІМРІЕ CODE 
1; 











可 以 使 用 下 述 的 shell 命 令 对 该 枚 举 类 型 的 宏 定义 进行 模拟 展开 ， 得 到 该 枚 举 类 型 的 定义 如 下 : 





[GCC&localhost paag-gcc]$ СІМРІЕ СОрЕ=`сгер ^DEFGSCODE gcc/gimple.def | sed s/\(/\ /g | sed s/,/\ /9 | awk '{print $2","}'` 
[GCC@localhost paag-gcc]$ echo $GIMPLE CODE 

enum gimple_code { 

GIMPLE ERROR MARK, GIMPLE COND, GIMPLE GOTO, GIMPLE LABEL, GIMPLE SWITCH, GIMPLE CHANGE DYNAMIC TYPE, 
GIMPLE ASSIGN, GIMPLE ASM, GIMPLE CALL, GIMPLE RETURN, GIMPLE BIND, СІМРІЕ CATCH, СІМРІЕ EH FILTER, 
GIMPLE PHI, GIMPLE RESX, GIMPLE TRY, СІМРІЕ МОР, GIMPLE OMP ATOMIC LOAD, GIMPLE OMP ATOMIC STORE, 
СІМРІЕ ОМР СОМТІМОЕ, GIMPLE OMP CRITICAL, GIMPLE OMP FOR, СІМРІЕ OMP MASTER, СІМРІЕ OMP ORDERED, 
GIMPLE OMP PARALLEL, GIMPLE OMP TASK, GIMPLE ОМР RETURN, GIMPLE OMP SECTION, GIMPLE OMP SECTIONS, 
GIMPLE OMP SECTIONS_SWITCH, GIMPLE OMP SINGLE, СІМРІЕ PREDICT, GIMPLE WITH CLEANUP EXPR, 
LAST_AND UNUSED GIMPLE CODE /% 最 后 一 个 GIMPLE CODE， 也 可 以 表示 GIMPLE CODE 的 个 数 */ 

1; 





在 gcc/gimple.c 中 也 定义 了 这 些 GIMPLE 语 句 名 称 的 字符 串 数 组 ， 即 gimple соде патеП, 





#define DEFGSCODE (SYM, МАМЕ, STRUCT) МАМЕ, 
const char *const дішріе соде name[] = { 
#include "gimple.def™ 

1; 

ЖипдеҒ DEFGSCODE 











对 于 不 同 种 类 的 GIM PLE 语 句 ， 可 能 会 使 用 不 同 的 结构 体 存储 ， 





操作 数 的 个 数 和 存储 的 地 址 也 不 完全 一 样 。 一 般 来 讲 ，GIMPLE 语 句 的 操作 数 以 tree 节 


点 指针 的 形式 出 现 ， 这 些 tree 指 针 和 连续 存放 ， 分 














别 指向 该 GIMPLE 语 句 的 第 0 操作 数 op0， 第 1 操作 数 op1 等 。 每 种 GIMPLE 语 句 中 op0 的 存储 地 址 相对 于 其 存储 结构 体 起 始 地 址 的 偏 移 量 都 是 一 个 常量 ， 并 被 
组 定义 如 下 : 





#define DEFGSCODE (SYM, NAME, STRUCT) (sizeof (STRUCT) - sizeof (tree)), 
const size_t gimple ops offset [] = { 

#include "gimple.def" 

1; 

ЖипдеҒ DEFGSCODE 


先 存储 在 gimple_ops_offset [] 数 组 中 ， 该 数 





























上 述 代 码 表示 ， 如 果 使 用 结构 体 STRUCT 来 存储 某 条 GIMPLE 语 句 ， 由 于 STRUCT 中 只 为 所 有 操作 数 中 的 第 0 操作 数 ( 即 op0) 分 配 了 空间 ， 其 他 操作 数 则 紧 接 着 op0 连 续 存 储 。 因 此 ， 相 对 于 结构 体 
STRUCT 的 起 始 地 址 来 说 ， 操 作 数 op0 存 储 的 偏 移 量 为 (sizeof (STRUCT) -sizeof (tree) ) ， 即 整个 结构 体 STRUCT 的 大 小 减 去 一 个 tree 节 点 的 大 小 。 





5.3 ”GIMPLE 的 表示 与 存储 


本 节 主 要 介绍 GCC 4.4.0 中 所 包含 的 33 种 GIMPLE 语 句 的 表示 与 存储 。 从 gcc/coretypes.h 中 可 以 看 到 如 下 定义 : 





typedef union gimple statement а *gimple; 





而 union gimple_statement_d 则 在 gcc/gimple.h 中 定义 如 下 : 





union gimple statement d 
{ 
struct gimple statement base gsbase; 
struct gimple statement with ops gsops; 
struct gimple statement with memory ops gsmem; 
struct gimple statement опр опр; | 
struct gimple statement bind gimple bind; 
struct gimple statement catch gimple catch; 
struct gimple statement eh filter gimple eh filter; 
struct gimple statement phi gimple phi; © 7 
struct gimple statement resx gimple resx; 
struct gimple statement try gimple try; 
struct gimple statement wce gimple wce; 
struct gimple statement asm gimple asm; 
struct gimple statement omp critical gimple omp critical; 
struct gimple statement omp for gimple omp for; 
struct gimple statement omp parallel gimple omp parallel; 
struct gimple statement omp task gimple omp task; 
struct gimple statement omp sections gimple omp sections; 
struct gimple statement omp single gimple omp single; 
struct gimple statement omp continue gimple omp continue; 


struct gimple statement omp atomic load gimple omp atomic load; 


struct gimple statement omp atomic store gimple omp atomic store; 


1; 








注 : 为 了 清晰 起 见 ， 省 略 了 宏 定 义 GTY 的 内 容 ， 可 以 对 这 一 部 分 内 容 使 用 如 下 命令 进行 删除 : 

















sed 's 八 (.*\) GTY.*)))\(.*\) /\IXXX\2/g' 























可 见 ， 与 使 用 union tree_node 来 表示 各 种 各 样 的 树 节点 类 似 ，GCC 使 用 union gimple_statement_d 来 表示 各 种 各 样 的 GIMPLE 语 句 。gimple 则 是 一 个 指向 该 联合 体 union gimple_statement_d 的 指 














针 ， 该 联合 体 的 成 员 变 量 包 括 了 struct gimple_statement_base、struct gimple_statement with_ops、struct gimp! 


























这 21 种 结构 体 来 表示 和 存储 所 有 5.2 节 中 给 出 的 33 种 GIMPLE 语 句 ， 而 且 都 可 以 使 用 union gimple_statement_d 对 其 进行 统一 的 描述 。 

















首先 来 看 struct gimple_statement_base 的 定义 。 


e_statement_with_memory_ops 等 21 种 存储 结构 体 。 也 就 是 说 ， 在 GCC 中 ， 就 是 使 





struct gimple statement base 


ENUM BITFIELD (gimple соде) code : 8; /% GIMPLE CODE */ 


unsigned int no warning 1; 

unsigned int visited 2 1] 

unsigned int nontemporal move s iy 

unsigned int plf 220% 

unsigned modified 2 

unsigned has Volatile орв z 1; 

unsigned references memory р $y 

unsigned int subcode :16; /ж 子 操作 代码 */ 
unsigned uid; 

location t location; /* 位 置信 息 */ 
unsigned num ops; /* 操作 数 个 数 */ 
struct basic block def *bb; 

tree block; 


1; 

















该 结构 体 是 所 有 GIMPLE 存 储 结构 体 的 “ 基 类 ” ， 描 述 了 GIMPLE 语 句 的 基本 特性 ， 例 如 ，GIMPLE_CODE、 操 作 数 个 数 、 源 文件 中 的 位 置 以 及 语法 块 信息 等 ， 其 中 的 code 字 段 描述 的 是 所 存储 的 
GIMPLE 语 句 的 类 型 (ВрСІМРІЕ CODE) ， 这 些 GIMPLE_CODE 的 值 由 5.2 节 中 给 出 的 枚 举 类 型 enum gimple_code 描 述 ; num_ops 字 段 给 出 了 该 GIMPLE 语 句 操作 数 的 个 数 ; bb 字段 给 出 了 该 GIMPLE 语 
句 所 在 的 基本 块 (basic block) 信息 ; block 字 段 则 描述 了 该 GIMPLE 语 句 所 在 的 词法 语句 块 信息 。 








再 来 看 一 个 存储 结构 体 的 描述 ， 该 结构 体 为 struct gimple_statement with_ops， 即 描述 带 有 寄存 器 操作 数 的 GIM PLE 语 句 的 存储 结构 ， 其 定义 如 下 : 


/* 只 有 寄存 器 操作 数 的 GIMPLE 语 句 使 用 的 存储 结构 */ 


struct gimple statement with ops 


struct gimple statement with ops раѕе орраѕе; 
tree ор[1]; 
1; 








其 中 ，struct gimple_statement_with_ops_base 定 义 如 下 : 





struct gimple statement with орѕ base 


struct gimple statement base gsbase; 
bitmap addresses taken; 

struct def optype d *def ops; 
struct изе optype d *use орз; 


1; 





这 3 种 结构 体 的 关系 如 图 5-1 所 示 。 





struct gimple Statement with ops 


ЕР addresses (акеп: 
struct def optype а “дает ор; 
struct use optype а *use ops; 


struct gimple statement base 


ЕМОМ BITFIELD (gimple сойе) code: 5; 
unsigned int по уагпіпо 
unsigned int visited 

unsigned int nontemporal move 
unsigned int plf 

unsigned modified 

unsigned has _ volatile ops 
unsigned references memory р 
unsigned int subcode 

unsigned uid; 

location t location; 

unsigned num ops; 

struct basic block def *bb; 

tree block; 


ve ve ve v». 3 
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5-1 ct gimple_statment_with_ops 结 构 体 示 例 





























那么 ， 各 种 不 同类 型 的 GIMPLE 语 句 分 别 使 用 上 述 的 哪 种 结构 体 进行 存储 呢 ? 即 具有 某 个 特定 GIMPLE_CODE 的 GIMPLE 语 句 要 使 用 哪 种 结构 体 进行 存储 呢 ? 











在 gcc/gimple.h 中 有 如 下 的 宏 定 义 : 


enum gimple statement Structure епот ( 

GSS_BASE, 055 WITH ОР5, GSS WITH МЕМ OPS, GSS ОМР, 055 BIND, GSS_CATCH, 

655 ЕН FILTER, 655 РНІ, GSS RESX, 655 TRY, 055 ИСЕ, GSS АЗМ, GSS ОМР CRITICAL, 
GSS_OMP РОБ, GSS OMP PARALLEL, GSS ОМР TASK, GSS OMP SECTIONS, 

С55 ОМР SINGLE, 655 OMP CONTINUE, GSS_OMP ATOMIC LOAD, GSS OMP АТОМІС STORE, 
LAST GSS ENUM (结束 标志 ) 

1; 


每 个 枚 举 项 都 分 别 对 应 了 gimple 联 合体 中 的 某 一 种 结构 体 ， 共 21 个 。 








下 面 以 一 个 GIMPLE_RETURN 为 例 ， 说 明 如 何 创建 存储 该 GIMPLE_RETURN 语 句 的 存储 结构 ， 其 中 就 说 明了 对 于 不 同 的 GIMPLE_CODE 的 GIMPLE 语 句 ， 分 别 使 用 什么 结构 体 进行 存储 的 问题 。 

















回 





GIMPLE_RETURN<RETVAL> 表 示 一 个 返 








语句 ， 其 中 RETVAL 是 返回 值 ， 可 以 为 空 ， 该 GIMPLE 语 句 的 声明 如 下 : 


DEFGSCODE (GIMPLE RETURN, "дішріе return", struct gimple statement with пепогу орѕ) 





gcc/gimple.c 中 创建 GIMPLE_RETURN 语 句 的 代码 如 下 : 





/* 创建 一 个 返回 值 为 RETVAL 的 GIMPLE ВЕТОВМ 9 */ 
gimple 
gimple build return (tree retval) 
{ /* 创建 所 需 的 存储 空间 ，3 个 参数 分 别 是 GIMPLE_ CODE、SUBCODE 及 操作 数 个 数 */ 
gimple s = gimple build with ops (GIMPLE RETURN, 0, 1); 
/* 设置 返回 值 */ 
if (retval) 
gimple return set retval (s, retval); 
return в; 














其 中 ，gimple_build_with_ops 函 数 就 是 创建 具有 给 定 GIMPLE_CODE 及 SUBCODE， 并 且 具 有 n 个 操作 数 的 GIMPLE 语 句 ， 其 定义 为 : 





#define gimple build with орв(с, в, п) gimple build with ops stat (с, в, п) 
static gimple 
gimple build with орв stat (епот gimple code code, enum tree соде subcode, unsigned пит ops) 
{ 
gimple з = gimple а11ос stat (code, num ops); /* 按 GIMPLE CODE 及 操作 数 个 数 分 配 空间 */ 
gimple set subcode (s, subcode); /* 设置 subcogde */ 
return s; | 


} 




















进一步 跟踪 gimple аПос stat (с, n) 函数 ， 其 作用 是 为 GIMPLE_CODE 为 c、 操 作 数 个 数 为 n 的 GIMPLE 语 名 分配 存储 空间 ， 本 例 中 函数 参数 c=GIMPLE_ CODE，n=1， 其 空间 分 配 的 过 程 如 下 : 





static gimple 
gimple alloc stat (enum gimple code code, unsigned num ops) 
{ 
size t size; 
gimple stmt; 
size = gimple size (code); /% 根据 GIMPLE CODE 获 取 对 应 存储 结构 体 及 其 大 小 */ 
/* 由 于 第 0 操作 数 存储 在 指定 的 结构 体 中 ， 因 此 ， 在 指定 的 结构 体 之 后 ， 还 需要 存储 (n-1) 个 操作 数 的 室 间 */ 
if (num ops > 0) 
size += sizeof (tree) % (num ops - 1); 
stmt = (gimple) ggc_alloc cleared stat (size); 
/* 设置 GIMPLE СОПЕ МЕЖЕ */ T 
gimple_set_code (stmt, code); 
gimple set пот ops (stmt, num ops); 
stmt->gsbase.modified = 1; 
return stmt; 


























从 上 述 的 代码 可 以 看 出 ，gimple 结 构 分 配 的 存储 空间 大 小 size 是 由 该 GIMPLE 语 句 的 GIMPLE_CODE 及 其 操作 数 的 个 数 所 决定 。 其 中 gimple_size (code) 用 来 计算 存储 对 应 GIMPLE_CODE 语 句 所 需要 
的 存储 结构 体 及 其 大 小 ， 该 过 程 分 为 两 个 阶段 : 

















(1) 调用 gss Ғог code (code) 函数 ,通过 GIMPLE_CODE 查 找 对 应 的 存储 结构 体 (Gimple Statement Structure) 的 标识 GSS (使 用 枚 举 类 型 enum gimple_statement structure _ enum gss 表 














示 ) 。 





static enum gimple statement structure enum 

gss_for code (enum gimple code code) | 

{ 

switch (code) 

{ 
сазе GIMPLE ASSIGN: 
Case GIMPLE CALL: 
Case GIMPLE RETURN: return GSS WITH MEM OPS; 
case GIMPLE COND: СЕЕ 
сазе GIMPLE СОТО: 
сазе GIMPLE LABEL: 
Case GIMPLE CHANGE DYNAMIC TYPE: 


Case GIMPLE SWITCH: return GSS WITH OPS; 
сазе GIMPLE ASM: return 655 А5М; 

/* 省 略 部 分 代码 */ 

default: gcc_unreachable (); 





可 以 看 出 ， 对 于 GIMPLE_CODE 为 GIMPLE_ASSIGN、GIMPLE_CALL 及 GIMPLE_RETURN 的 GIMPLE 语 句 ， 返 回 的 GSS 为 GSS_WITH_MEM_OPS， 即 带 有 内 存 操作 数 的 存储 结构 体 ; 对 于 
GIMPLE_COND、GIMPLE_GOTO 等 GIMPLE 语 句 ， 则 返回 的 GSS 为 GSS_WITH_OPS， 即 带 有 操作 数 的 存储 结构 体 。 


(2) 根据 GSS 的 值 ， 查 找 相应 的 存储 结构 体 ， 并 返回 相应 的 存储 空间 大 小 。 





在 获得 了 GSS 后 ， 可 以 根据 GSS 的 值 ( 或 者 GIMPLE_CODE 的 值 )， 返 回 相 应 的 结构 体 大 小 。 





static size 七 
gimple size (enum gimple code code) 
enum gimple statement structure enum gss = gss for code (code); 
if (gss == GSS WITH OPS) 
return sizeof (struct gimple statement with ops); 
else if (gss == 055 WITH МЕМ OPS) 5 
return sizeof (struct gimple statement with пепогу орз); 
switch (code) с T T T 


{ 
case GIMPLE ASM: 
return sizeof (struct gimple statement asm); 
/ж 省 略 部 分 代码 */ 
default: 
break; 
} 


gcc_unreachable (); 














可 见 ， 对 于 某 种 GIMPLE 语 句 分 配 其 存储 空间 时 ， 首 先 通过 该 语句 的 GIMPLE_CODE 作 为 参数 ， 由 函数 gss_for_code () 获取 该 GIMPLE 语 句 对 应 的 GSS (GIMPLE Statement Structure) 的 枚 举 值 ， 
再 由 该 GSS 的 值 或 者 GIMPLE_CODE 来 确定 存储 结构 体 及 其 大 小 。 因 此 ， 对 于 一 个 GIMPLE 语 句 来 说 ， 其 总 的 存储 空间 的 大 小 为 : 














总 的 存储 空间 = sizeof (对 应 存储 结构 体 ) + (操作 数 个 数 -1)* sizeof (tree) 














常见 的 GIMPLE_CODE 对 应 的 GSS 及 存储 该 GIMPLE 语 句 的 结构 体 之 间 的 关系 如 表 5-2 所 示 。 通 过 表 5-2 可 以 看 出 ,为 一 个 GIMPLE_RETURN 语 句 分 配 存 储 空间 时 ， 其 GSS 值 为 GSS_ WITH_MEM_OPs， 
相应 的 存储 结构 体 为 struct gimple_statement_with_memory_ops， 如 果 该 GIMPLE_RETURN 语 句 的 返回 值 RETVAL 不 为 空 时 ， 该 返回 值 将 作为 GIMPLE_RETURN 语 句 的 操作 数 存 储 在 该 结构 的 tree op[1] 
字段 中 。 




















Ж5-2 ”GIMPLE_CODE/GSS/ 存 储 所 使 用 的 结构 体 


GSS: Gimple Statement 
GIMPLE CODE д 存储 时 使 用 的 结构 体 
Structure 
struct gimple statement | 
GIMPLE ASSIGN GIMPLE CALL GIMPLE RETURN |GSS WITH MEM OPS . 
一 一 = 一 = т with тетогу орѕ 
GIMPLE COND GIMPLE СОТО GIMPLE LABEL struct gimple statement 
一 22 Е 6585 МІТН OPS . 一 一 
GIMPLE CHANGE DYNAMIC ТҮРЕ GIMPLE SWITCH 一 一 with орѕ 
struct glimple_statement | 
СІМРІЕ ASM GSS_ASM 
asm; 
struct gimple_ statement_ 
СІМРІЕ ВІМО 6585 ВІМр | 
= 2 bind; 
struct gimple_statement_ 
GIMPLE_CATCH GSS_CATCH 
一 一 catch; 
struct gimple_statement_ 
GIMPLE ЕН ЕПТЕК 655 ЕН _ FILTER | 
т > т > eh filter; 
struct gimple_statement_ 
GIMPLE_NOP GSS_BASE b 
ase; 


(%) 


GSS: Gimple Statement 


GIMPLE CODE 存储 时 使 用 的 结构 体 
Structure 
GIMPLE PHI 655 РНІ -- 
struct gimple_statement_ 
GIMPLE_RESX GSS_RESX 
resx; 
struct gimple_statement_ 
GIMPLE_TRY GSS_TRY 
Е Е try; 
struct gimple_statement_ 
GIMPLE_WITH_CLEANUP_EXPR GSS_WCE 
усе; 
struct gimple_statement 
СІМРІЕ OMP CRITICAL 655 ОМР CRITICAL Е Е 一 
Я = Е Е отр сгійса!; 
struct сітіріе statement | 
СІМРІЕ ОМР FOR 655 ОМР FOR 


omp_for; 
GIMPLE OMP MASTER GIMPLE OMP ORDERED 
GIMPLE ОМР SECTION 


СІМРІЕ ОМР RETURN 
GIMPLE ОМР SECTIONS SWITCH 


struct gimple Statement 
GSS_OMP 
отр; 


struct gimple_statement_ 
GSS_BASE 
base; 


struct gimple_statement_ 
GIMPLE_OMP_CONTINUE GSS_OMP_CONTINUE А 
Е Е Е E omp_continue; 


struct gimple_statement 
GIMPLE OMP PARALLEL GSS OMP PARALLEL = т 
Е Е Е т отр _parallel; 


struct gimple Statement 
GIMPLE OMP TASK 655 OMP ТА5К 
Е Е Е Е отр 1а5К; 


struct gimple statement | 
СІМРІЕ ОМР SECTIONS 655 ОМР SECTIONS i 
Е 一 E 一 omp_sections; 


struct gimple_statement_ 
GIMPLE OMP _ SINGLE GSS_OMP_SINGLE | 
Е Е Е т отр віпсіе; 


struct gimple_statement_ 
GIMPLE OMP ATOMIC LOAD GSS OMP ATOMIC LOAD . 
= Е = Е Е Е отр аіютіс load; 


struct gimple_statement_ 
GIMPLE_OMP_ATOMIC_STORE GSS_OMP_ATOMIC_STORE . 
Б Т Е Е Е отр аѓотис 5іоге; 





struct gimple_statement_ 
GIMPLE_PREDICT GSS_BASE b 
ase; 


54 ”GIMPLE 语 句 的 操作 数 


在 GIMPLE 语 句 的 声明 中 可 以 看 出 ， 有 些 GIMPLE 语 句 带 有 操作 数 ， 有 些 GIMPLE 语 句 不 带 操作 数 。 对 于 带 有 操作 数 的 GIMPLE 语 句 来 说 ， 这 些 操作 数 的 节点 指针 (类 型 为 tree) 将 被 连续 存放 在 从 该 结 
构 体 最 后 一 个 成 员 tree op[1] 开 始 的 连续 地 址 中 。 带 有 操作 数 的 GIMPLE 语 句 包括 : 





DEFGSCODE (GIMPLE COND, "gimple сопа", struct gimple statement with орз) 

DEFGSCODE (GIMPLE СОТО, "дішріе добо", struct gimple statement with ops) 

DEFGSCODE (GIMPLE LABEL, "дішріе label", struct gimple statement with ops) 

DEFGSCODE (GIMPLE SWITCH, "дішріе switch", struct gimple statement with ops) 

DEFGSCODE (СІМРІЕ CHANGE DYNAMIC ТҮРЕ, "gimple сһапде dynamic type", struct gimple statement with ops) 
DEFGSCODE (GIMPLE ASSIGN, "дішріе assign", struct gimple statement with пепогу орѕ) 

DEFGSCODE (GIMPLE ASM, "дішріе asm", struct gimple statement asm) 

DEFGSCODE (GIMPLE CALL, "gimple са11", struct gimple statement with memory орв) 

DEFGSCODE (СІМРІЕ RETURN, "gimple return", struct gimple statement with memory ор) 

















在 gcc/gimple.c 中 定义 了 一 个 函数 ， 用 来 判断 某 个 GIMPLE 语 句 是 否 具有 操作 数 ， 其 定义 如 下 : 











/* 判断 GIMPLE 语 句 g 是 否 有 操作 */ 
static inline bool 
gimple has ops (const gimple 4) 


return gimple code (9) >= GIMPLE COND && gimple code (9) <= GIMPLE RETURN; 








也 就 是 说 ， 当 GIMPLE CODE 介 于 GIMPLE COND 及 GIMPLE_RETURN 之 间 (包括 这 两 个 GIMPLE СОПЕ) 时 ， 该 GIMPLE 语 句 具有 操作 数 。 











对 于 有 操作 数 的 GIM PLE 语 句 (GCC 4.4.0 中 包括 9 种 ) ， 可 以 采用 的 存储 结构 体 只 可 能 是 如 下 的 3 种 之 一 : 














struct gimple statement asm; 
struct gimple statement with memory_ops; 
struct gimple statement with ops 





这 3 种 结构 中 均 包 含 了 操作 数字 段 tree op[1]， 然 而 该 字段 只 能 存储 1 个 操作 数 的 节点 指针 。 如 果 该 语句 只 有 1 个 操作 数 ， 则 将 该 操作 数 的 节点 指针 直接 存储 到 该 字段 中 ， 当 操作 数 的 个 数 超过 1 个 ， 则 采 
连续 存储 ， 即 将 第 0 操作 数 存 储 在 上 述 结构 体 的 tree op[1] 字 段 中 ， 即 op[0] 中 ， 而 第 1 操作 数 op1 则 存储 在 op[1] 中 ， 第 2 操作 数 op2 则 存储 在 op[2] 中 。 显 然 ， 操 作 数 op1 和 操作 数 op2 的 存储 空间 超出 了 相 
应 存储 结构 体 的 范围 ， 因 此 ， 在 分 配 存储 空间 时 ， 不 仅 要 为 这 些 存储 的 结构 体 本 身分 配 空间 ， 还 要 在 这 些 结构 体 后 连续 的 地 址 空间 上 为 操作 数 op1 和 操作 数 op2 (如 果 有 这 些 操作 数 的 话 ) 分 配额 外 的 存储 空 









































到 5-2 给 出 了 一 个 使 用 struct gimple_statement_with_ops 结 构 存 储 GIMPLE_ASSIGN 语 句 及 其 操作 数 的 例子 ， 假 设 该 语句 有 3 个 操作 数 ， 分 别 为 左 操作 数 和 两 个 右 操作 数 ， 那 么 实际 分 配 存储 空间 的 大 
小 为 : 

















分 配 空间 大 小 = sizeof (struct gimple statement with ops)+ (3-1) * sizeof (tree) 


这 样 ， 就 可 以 将 两 个 右 操作 数 连续 存放 在 struct gimple_statement_with_ops 结 构 体 之 后 ， 以 后 就 可 以 通过 该 结构 体 中 第 0 个 操作 数 的 地 址 对 所 有 的 操作 数 进行 访问 。 


struct 
gimple_statement with ops_base opbase; struct gimple_ statement with ops 





tree ор[1]; // 左 操作 数 : op0 


ы ны 7 ТЕСТІ Т” ЖЕН 所 有 的 操作 数 





图 5-2 GIMPLE 操 作 数 的 存储 示例 











例如 ，GIMPLE_ASSIGN 语 句 的 形式 为 : 





GIMPLE ASSIGN <SUBCODE, LHS, RHS1[, RHS2]> 





RHS 操 作 数 的 个 数 由 SUBCODE 决 定 ， 可 以 通过 函数 get_gimple_rhs_ num_ops (subcode) 获得 ， 所 以 GIMPLE_ASSIGN 语 句 操作 数 的 数目 为 右 操作 数 数目 + 左 操作 数 数目 ， 即 : 





num ops = де gimple rhs пот ops (SUBCODE) + 1; 








根据 表 5-2 可 以 看 出 ， 该 GIMPLE_ASSIGN 语 句 存储 时 使 用 的 结构 体 为 struct gimple_statement_with_memory_ops， 因 此 ， 为 该 GIMPLE 语 句 分 配 空间 的 大 小 为 : 














size = sizeof (struct gimple statement with memory ops) + sizeof (tree)* (num ops - 1); 





减 1 的 原因 是 第 0 操作 数 已 经 在 struct gimple_statement_with_memory_ops 中 分 配 了 ， 可 以 从 下 面 给 出 的 struct gimple_statement_with_memory_ops 定 义 中 看 到 。 

















struct gimple statement with memory ops СТҮ(()) 


struct gimple statement with memory ops раѕе membase; 
tree op[1]; 








另外 ， 对 于 不 同 的 带 有 操作 数 的 GIMPLE 语 句 ， 其 使 用 的 存储 结构 可 能 是 不 同 的 ， 操 作 数 存放 的 位 置 相对 于 其 存储 结构 体 的 首 地 址 的 偏 移 量 也 是 不 同 的 ， 那 么 如 何 访问 这 些 操作 数 呢 ? 为 了 解决 这 个 问 
题 ，gimple.h 中 提供 了 一 个 计算 操作 数 偏 移 量 的 方法 。 





在 每 种 GIMPLE 的 声明 中 有 一 个 结构 体 的 声明 ， 该 结构 体 就 是 为 了 计算 操作 数 的 偏 移 量 。 例 如 GIMPLE_ASSIGN 的 声明 为 : 





DEFGSCODE (GIMPLE ASSIGN, "дішріе assign", struct gimple statement with memory орв) 








其 中 ， 最 后 一 项 为 struct gimple_statement with_memory_ops， 就 是 为 了 计算 操作 数 的 偏 移 量 ， 该 偏 移 量 的 值 为 : 





sizeof (struct gimple statement with _ memory орв) - sizeof (tree). 











为 了 方便 访问 操作 数 ， 对 于 所 有 的 GIMPLE 语 句 (不 管 是 否 有 操作 数 ) ， 定 义 了 以 GIMPLE_CODE 为 索引 的 操作 数 偏 移 量 数组 gimple_ops_offset_[]， 用 来 存放 每 种 GIMPLE 语 句 的 操作 数 相对 于 存储 结 
构 体 首 地 址 的 偏 移 量 。 该 数组 的 初始 化 在 gcc/gimple.c 中 完成 ， 如 下 : 























#define DEFGSCODE (SYM, NAME, STRUCT) (sizeof (STRUCT) - sizeof (tree)), 
const size_t gimple ops offset [] = { 
#include "gimple.def" 


1; 
#undef DEFGSCODE 




















有 了 操作 数 偏 移 量 的 数组 gimple_ops_offset_ []， 获 取 GIMPLE 语 句 的 操作 数 就 变 得 简单 了 ， 获 取 操 作 数 的 起 始 地 址 就 可 以 使 用 gimple ops () 函数 实现 ， 如 下 : 








static inline tree % 
gimple ops (gimple дз) 
1 
if (Ідішріе һав ops (gs)) /* 判断 是 否 有 操作 数 */ 
return NULL; 


return ((Егее *) ((char %) gs + gimple ops offset [gimple соде (95)])); 
/* 强制 转换 成 操作 数 树 节点 指针 */ 














获取 GIMPLE 语 句 gs 的 第 i 个 操作 数 可 以 使 用 : 











/* 返回 GIMPLE 语 句 gs 的 第 i 个 操作 数 */ 
static inline tree 
gimple op (const gimple gs, unsigned i) 


if (gimple has ops (gs)) 
{ 


дсс assert (i < gimple num ops (gs)); /* 判断 操作 数 索 引 是 否 合法 */ 
return дішріе ops (СОМЅТ CAST СІМРІЕ (gs)) [i];/* 返回 第 i 个 操作 数 的 树 节点 指针 */ 
} 
е1ѕе 
return NULL TREE; 














获取 GIMPLE 语 句 gs 的 第 i 个 操作 数 的 地 址 则 可 以 使 用 : 











/* 返回 指向 GIMPLE 语 句 gs 的 第 i 个 操作 数 的 指针 */ 
static inline tree * 
gimple op ptr (const gimple gs, unsigned i) 


if (gimple has ops (gs)) 
{ 


дсс assert (i < gimple num ops (gs)); 
return gimple ops (CONST CAST СІМРІЕ (gs)) + i;/* 返回 第 i 个 操作 数 的 存储 地 址 */ 
} 
else 
return NULL; 





例如 ， 对 于 表示 GIMPLE_ASSIGN<SUBCODE，LHS，RHS1[，RHS2]> 的 一 个 GIMPLE 语 句 gs 来 说 ， 获 取 第 0 个 操作 数 LHS 时 ， 就 可 以 直接 使 用 gimple_op (gs, 0) ; 获取 第 一 个 右 操作 数 RHS1 时 ， 
则 可 以 使 用 gimple op (gs, 1) 。 如 果 该 GIMPLE 语 句 有 第 二 个 右 操作 数 RHS2， 那 么 可 以 使 用 gimple_op (gs, 2) 进行 访问 。 






































5.5 ”GIMPLE 语 句 序列 的 基本 操作 


AST/GENERIC 经 过 转换 将 形成 一 系列 的 GIMPLE 语 句 ，GCC 将 这 些 GIMPLE 语 句 组 织 成 一 种 线性 的 序列 ， 通 过 线性 序列 的 起 始 节 点 就 可 以 逐一 进行 遍历 。 





gcc/gimple.h 中 定义 了 指向 GIMPLE 语 句 的 链表 节点 结构 (简称 为 语句 节点 ) ， 每 个 语句 节点 包含 指向 GIMPLE 语 句 的 指针 以 及 指向 该 节点 前 驱 和 后 继 语 句 节点 的 链表 指针 。 每 个 语句 节点 的 定义 用 结 
构 体 gimple_seq_node_d 来 描述 。 














/* gimple_seq_d 节 点 的 定义 */ 
struct gimple seq node d 


gimple stmt; 

struct gimple seq node d *prev; 
struct gimple seq node d *next; 
1; 





另外 ， 为 了 更 方便 地 对 所 有 GIMPLE 语 句 序 列 进行 操作 ， 还 定义 了 一 个 GIMPLE 序 列 的 描述 节点 (简称 为 序列 节点 ) ， 该 序列 节点 包括 了 三 个 字段 ， 分 别 指向 每 个 GIMPLE 序 列 中 的 第 一 个 语句 节点 、 最 
后 一 个 语句 节点 以 及 下 一 个 空闲 的 序列 节点 (注意 ， 不 是 空闲 的 语 名 节点) 。 序 列 节点 的 定义 如 下 : 





typedef struct gimple seq а *gimple вес; 
/* 使 用 双向 链表 链接 起 来 的 GIMPLE 语 白 序列 */ 
struct дішріе ѕеа а 

1 


gimple seq node first; 

gimple seq node last; 

gimple seq next free; 
1; 








Ий] 








5-3 给 出 了 上 述 数 据 结构 之 间 的 关系 。 注 意 ，struct gimple_seq_d 及 struct gimple_seq_node d 的 关系 和 4.3.22 节 的 struct tree_statement list 及 struct tree_statement list_node 的 关系 很 类 似 ， 可 
以 对 比分 析 。 








Struct Struct 
gimple ѕед а gimple seq node а 


gimple stmt; сітріе я) 





gimple stmt; сітріе ін) 





gimple stmt; gimple 语 句 





gimple stmt; gimple 语 句 


5-3 GIMPLE 序 列 节点 、GIMPLE 语 句 节点 及 GIMPLE 语 身 





针对 GIMPLE 语 名 序列 ，gcc/gimple.h 中 也 提供 了 一 些 相应 的 函数 ， 以 下 这 些 函数 的 功能 基本 上 都 可 以 从 函数 名 称 上 看 出 来 ， 不 再 理 述 。 





[GCC@localhost paag-gcc]$ grep “gimple seq gcc/gimple.h 
gimple seq first (const gimple seq s) 
gimple seq first stmt (const gimple seq s) 
gimple seq last (const gimple ѕед s) 

gimple seq last stmt (const gimple seq s) 
gimple seq set last (gimple seq s, gimple seq node last) 
gimple seq set first (gimple seq s, gimple seq node first) 
gimple seq empty р (const gimple seq в) 

gimple seq alloc with stmt (gimple stmt) 

gimple seq gimple body (tree); 

gimple seq gimple вед alloc (void); 

gimple seq gimple seq copy (gimple seq); 
gimple seq singleton p (gimple seq seq) 

gimple seq gsi split seq after (gimple stmt iterator); 
gimple seq gsi split seq before (gimple stmt iterator %); 





另外 ,为 了 方便 地 操作 GIMPLE 语 句 序列 ，GCC 中 还 提供 了 一 个 GIMPLE 语 句 的 枚 举 器 (lterator) ， 该 枚 举 器 的 定义 如 下 : 





typedef struct 

{ 
gimple seq поде ptr; 
gimple seq seg; 
basic block bb; 

} gimple stmt iterator; 





该 枚 举 器 的 三 个 字段 分 别 给 出 了 包含 某 个 GIMPLE 语 句 的 语句 节点 、 序 列 节点 以 及 基本 块 的 信息 。 
在 gcc/gimple.c 中 定义 了 一 些 与 枚 举 器 相关 的 函数 。 


(1) 枚 举 器 的 生成 : 





static inline gimple stmt iterator gsi_start (gimple seq seq) 生成 指向 语 自序 列 seq 中 第 一 条 GIMPLE 语 句 的 枚 举 器 

static inline gimple stmt iterator gsi start bb (basic _ block bb) 生 成 指向 基本 块 bb 中 第 一 条 GIMPLE 语 句 的 枚 举 器 

static inline gimple stmt iterator gsi last (gimple seq seq) 生成 指向 语句 序列 seq 中 最 后 一 条 GIMPLE 语 句 的 枚 举 器 

static inline gimple stmt iterator gsi last Ыр (basic block bb) 生成 指向 基本 块 bb 中 最 后 一 条 GIMPLE 语 句 的 枚 举 器 

static inline gimple stmt iterator gsi after labels (basic block bb) 返 回 一 个 指向 基本 块 bb 中 第 一 条 不 是 标签 的 语句 的 枚 举 器 





(2) 枚 举 器 中 语句 的 判断 : 





static inline bool gsi епа р (gimple stmt iterator i) 枚 举 器 i 是 否 指向 当前 语句 序列 中 的 最 后 一 个 语句 节点 

static inline bool gsi опе before епа р (gimple stmt iterator i) 枚 举 器 i 是 否 指 向 当前 语句 序列 中 的 倒数 第 2 个 语 自 节点 
static inline void gsi пех (gimple stmt iterator *i) 枚 举 器 i 指向 当前 语句 序列 中 的 下 一 个 语 身 节点 

static inline void gsi prev (gimple stmt iterator *i) 枚 举 器 i 指向 当前 语句 序列 中 的 前 一 个 语 自 节点 

static inline gimple gsi stmt (gimple stmt iterator i) 获 取 当 前 语句 节点 所 指向 的 GIMPLE 语 句 





(3) 枚 举 器 中 信息 的 提取 : 





static inline gimple * 95і біле ріг (gimple stmt iterator *i) 返 回 枚 举 器 i 指向 的 GIMPLE 语 身 指针 
static inline basic block gsi bb (gimple stmt iterator 1) 返回 枚 举 器 i 指向 的 基本 块 指 入 
static inline gimple seq gsi seq (gimple stmt iterator i) 返 回 枚 举 器 i 指向 的 语句 序列 节点 指针 





例 5-3 ”GIMPLE 语 句 榴 举 器 的 使 用 








假设 初始 的 GIMPLE 语 句 序列 如 图 5-4a 所 示 ， 首 先 使 用 gsi=gsi_start (seq) 生成 一 个 指向 seq 语 句 序列 的 枚 举 器 gsi， 此 时 gsi 的 值 如 图 5-4b 所 示 。 执 行 gsi_next (&gsi) 后 ，gsi 的 值 如 图 5-4c 所 示 ， 即 





















gimple seq seq gimple seq node 
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gimple stmt; 


а) 初始 的 GIMPLE 语 名 序列 、 语 名 序列 节点 及 GIMPLE 语 句 
gimple_seq seq gimple seq node 




























е 
| 
gimple stmt; gimple 语 句 
ptr - 














gimple stmt; gimple 语 句 


b ) 使 用 gsi = gsi_start (seq) 建 并 GIMPLE 语 句 枚 举 器 


gimple seq seq gimple seq node 
gimple 语 句 








first 


gsi 
| | | 


gimple stmt; 


ргеу пехі 





gimple 语 句 








另外 ,在 GCC 中 ， 当 函数 的 控制 流 | 


ptr -' 


. gimple stmt; gimple 语 名 





с) 执行 gsi_ next(&gsi) 后 的 情况 


5-4 GIMPILE 语 句 枚 举 器 的 使 用 









































0 





(СЕС, Control Flow Graph) 建立 之 后 ， 针 对 该 基本 块 中 每 一 条 GIMPLE 语 句 进行 某 种 处 理 时 ， 经 常 使 用 如 下 的 代码 形式 : 





дішріе stmt iterator gsi; 
FOR EACH ВВ (bb) 


for 


{ 


(gsi = gsi_start_bb (bb); !gsi_end p (gsi); gsi_next (&gsi)) 


gimple stmt = gsi_stmt (gsi); 
/% TODO: 对 该 GIMPLE 语 名 进行 处 理 */ 


} 











其 











要 的 过 程 就 是 针对 每 个 基本 块 ， 首 先 调用 gsi=gsi_start bb (bb) 生成 一 个 生成 指向 基本 块 bb 中 第 一 个 GIMPLE 语 句 的 枚 举 器 gsi， 此 时 gsi_stmt (gsi) 则 指向 该 基本 块 中 的 第 一 条 GIMPLE 语 句 。 





通过 gsi_end_p (gsi) 来 判断 是 否 到 达 该 基本 块 语句 序列 的 最 后 一 条 语句 ， 如 果 没 有 到 达 ， 则 通过 gsi_next (&gsi) 使 得 gsi 指 向 下 一 条 语句 ， 从 而 完成 对 该 基本 块 中 每 条 GIMPLE 语 句 的 遍历 。 


5.6 ”GIMPLE 的 生成 


GIMPLE 是 语言 无 关 的 中 间 表 示 形 式 ， 那 么 从 AST/GENERIC 是 如 何 生 成 GIMPLE 中 间 表 示 的 呢 ? 本 节 首先 给 出 GIMPLE 生 成 的 基本 流程 ， 后 续 章节 将 对 GIMPLE 生 成 过 程 中 的 各 个 阶段 进行 详细 分 析 。 


对 于 (语言 来 齐 ，AsT/GENERIC 到 GIMPLE 的 转化 在 /gcc/c-gimplify.c 中 进行 。 一 般 来 说 ，GIMPLE 的 生成 是 以 函数 为 单位 进行 。 当 GCC 前 端 完成 一 个 函数 的 词法 /语法 分 析 后 ， 将 会 生成 该 函数 对 应 的 


AST， 然 后 调 
GIMPLE 序 列 

















函数 c_ genericize (tree fndecl) 对 函数 fndecl 的 AST 进 行规 范 化 处 理 。 在 c_genericize (tree fndecl) 中 ， 将 会 进一步 调用 gimplify function_tree (fndecl) 将 当前 函数 AST 转 换 成 




















， 其 中 参数 fndecl 就 是 将 要 转换 的 函数 声明 节点 。 因 此 ， 可 以 认为 gimplify function_tree (fndecl) 就 是 GIMPLE 序 列 生成 的 入 口 函数 ， 该 函数 执行 结束 时 ， 函 数 fndecl 对 应 的 AsT 就 已 经 被 





转换 成 相应 的 





GIMPLE 序 列 。 


首先 来 分 析 函 数 c genericize 的 主要 框架 。 








void c_genericize (tree Епдесі) 


{ 
/ж 其 他 代 


ш */ 


с gimp rity бенен ыза (Ёпдес1); /% 以 函数 为 单位 ， 完 成 AST/GENERIC 到 GIMPLE 的 转换 */ 
* 其 他 代码 + 














可 以 看 出 ,该 函数 中 并 没有 进行 AST 到 GENERIC 形 式 的 转换 ， 而 是 直接 调用 gimplify function_tree 进 行 GIMPLE 的 生成 。 出 现 这 种 情况 可 以 这 样 来 解释 :语言 是 GCC 默认 支持 的 前 端 语 言 ， 其 AST 节 
点 均 为 符合 GENERIC 要 求 的 节点 ， 所 有 树 节点 都 是 gcc/tree.h 中 定义 的 标准 节点 ， 因 此 ，C 语 言 前 端 生成 的 AST 一 直 就 是 GENERIC 形 式 。 
































5.7 ”GIMPLE 转 换 实例 


EHE 











语句 转换 使 





JAST/GENERIC 转 化 成 GIMPLE 的 基本 流程 ， 即 每 个 函数 对 应 的 AST/GENERIC 均 由 gimplify function_tree 进 行 处 理 ， 最 后 转换 成 函数 参数 和 函数 体 中 每 条 语句 对 应 的 GIMPLE 序 列 。 对 每 一 条 
gimplify_stmt 函 数 ， 进 而 调用 gimplify_expr 遂 数 ， 根 据 其 TREE_CODE， 分别 执行 相应 的 转换 函数 gimplify *(* 大 致 与 TREE_CODE 对 应 ) ， 这 些 相应 的 函数 根据 处 理 的 TREE_CODE 的 不 同 分 





























成 了 很 多 种 ， 











可 以 使 用 如 下 的 shell 命 令 查看 。 





[GCC@localhost paag-gcc]$ grep ^gimplify gcc/gimplify.c 
gimplify seq ада stmt (gimple вед *seq р, gimple gs) 


gimplify seq ада seq (gimple seq *dst р, gimple seq src) 


gimplify апа ада (tree t, gimple seq *seq р) 


gimplify and return first (tree t, gimple seq *seq p) 


gimplify bind expr (tree *expr p, gimple seq *pre p) 


gimplify return expr (tree stmt, gimple seq *pre p) 


gimplify vla десі (tree десі, gimple seq *seq р) 


gimplify десі expr (tree *stmt р, gimple seq *seq р) 


gimplify loop expr (tree *expr p, gimple seq *pre p) 


gimplify statement list (tree *expr p, gimple seq *pre p) 


gimplify switch expr (tree *expr p, gimple seq *pre p) 


gimplify case label expr (tree *expr p, gimple seq *pre p) 


gimplify exit expr (tree *expr p) 


gimplify conversion (tree *ехрг р) 


gimplify var or parm десі (tree *ехрг р) 


gimplify compound lval (tree *ехрг р, gimple seq “рге р, gimple seq *роѕї р, 


gimplify self тоа expr (tree *expr р, gimple seq “рге р, gimple seq *роѕї р, 


gimplify arg (tree *arg p, gimple seq *pre p, location t call location) 


gimplify call expr (tree *expr p, gimple seq *pre p, bool want value) 
gimplify pure cond expr (tree *expr p, gimple seq *pre p) 
gimplify cond expr (tree *expr p, gimple seq *pre p, fallback t fallback) 
gimplify modify expr to memcpy (tree *expr p, tree size, bool want value, 
gimplify modify expr to memset (tree *expr p, tree size, bool want value, 


gimplify init ctor preeval 1 (tree *tp, int *walk subtrees, void *xdata) 
gimplify init ctor preeval (tree *ехрг р, дішріе seq “рге р, gimple seq *роѕї р, 
gimplify init ctor eval range (tree object, tree lower, tree upper, 

gimplify init ctor eval (tree object, VEC(constructor elt,gc) *elts, 
gimplify init constructor (tree *expr р, gimple seq *рге р, gimple seq *post р, 
gimplify modify expr rhs (tree *ехрг р, tree *from p, tree *to р, 


gimplify 


modify expr complex part (tree *ехрг р, gimple seq *рге р, 


gimplify modify expr (tree *ехрг р, дішріе seq *рге р, gimple ѕед *post р, 
gimplify variable sized compare (tree *expr p) 

gimplify scalar mode aggregate compare (tree *expr p) 

gimplify boolean expr (tree *expr p) 

gimplify compound expr (tree *expr p, gimple seq *pre p, bool want value) 
gimplify save expr (tree *ехрг р, gimple seq “рге р, gimple seq *роѕї р) 


gimplify addr expr (tree *ехрг р, дішріе seq “рге р, дішріе seq *post_p) 
gimplify asm expr (tree *expr р, gimple seq *pre р, gimple seq *post р) 
gimplify cleanup point expr (tree *expr p, gimple seq *pre p) 

gimplify target expr (tree *expr р, gimple seq “рге р, gimple seq *post р) 
gimplify stmt (tree *stmt p, gimple seq *seq p) 
gimplify scan отр clauses (tree *list р, gimple seq “рге р, 
gimplify adjust отр clauses 1 (splay tree поде п, void *data) 
gimplify adjust отр clauses (tree *list р) 

gimplify отр parallel (tree *expr р, gimple seq *рге р) 
gimplify omp task (tree *expr p, gimple seq *pre p) 

gimplify отр for (tree *ехрг р, gimple seq “рге р) 
gimplify отр workshare (tree *ехрг р, дішріе зей “рге р) 
gimplify отр atomic (tree *expr р, gimple seq *pre р) 

gimplify ехрг (tree *expr р, gimple seq “рге р, gimple seq *роѕі р, 
gimplify буре sizes (tree type, gimple seq *list р) 
gimplify опе sizepos (tree *expr р, gimple seq *stmt р) 

gimplify роду (tree *body р, tree fndecl, bool до parms) 

gimplify function tree (tree Епдесі) 








其 中 ， 常 见 的 TREE CODE 和 这 些 函 数 的 对 应 关系 可 以 参见 表 5-6。 























下 面 分 别 以 BIND_EXPR、STATEMENT_LIST_ EXPR、MODIFY_EXPR 以 及 POSTINCREMENT_EXPR 等 表达 式 的 转换 为 例 ， 对 上 述 部 分 函数 进行 分 析 ， 说 明 一 些 
他 函数 请 读者 自行 分 析 。 


58 实例 分 析 

















本 节 对 例 5-7 进 行 重演 ， 给 出 比较 完整 的 AsT 图 形 ， 并 分 析 完 成 GIM PLE 转 换 时 的 主要 函数 调用 等 。 




















为 了 方便 查看 ， 源 代码 重复 如 下 : 





体 的 AST 节 点 的 GIMPLE 生 成 过 程 。 其 





[GCC@localhost gimplify]$ cat -n gimplify self поді.с 
lint self поаі () { 





















































2іпё а-0; 
3int Б; 
4 Б-ан; 
5 return Ы; 
6} 
其 AsT 节 点 的 文字 描述 详 见 例 5-7， 其 对 应 的 AsT 图 形 如 图 5-14 所 示 。 为 了 清晰 起 见 ， 该 图 省 略 了 一 些 类 型 、 大 小 等 节点 ， 主 要 给 出 了 标识 符 节点 、 函 数 声明 、 变 量 声明 、 结 果 声 明 节 点 、 表 达 式 节点 以 
及 这 些 节点 之 间 的 关系 ， 同 时 每 个 节点 上 都 标注 了 该 节点 的 地 址 (这 些 调试 过 程 中 的 地 址 ， 可 能 与 读者 调试 时 观察 到 的 值 不 同 ) 。 








1: function decl 




















4: bind expr 
body | addr: b7d51190 


| 


2: identifier node 
strg: Self modi ЕС b7d88c08 











| 10: statement 1164 












3 | addr: Һ748е8ас 













21: decl ехрг 22: modify expr 
аааг: b7d02500 | op0 | ор! | addr: b7cfc60c 


addr: b7d02520 





32: modify ехрг 
орі | addr: b7cfc630 









31: postincrement ехрг 
ор! | addr: b7cfc5e8 


















18: var_decl 34: result десі | | 9: уаг есі 


33: integer_cst 









addr: b7cfdle0 


name | addr: b7d8f000 








30: identifier node 17: identifier node 


strg: b | addr: b7d88cb0 strg: a| addr: b7d88c78 























5-14 函数 self modi 的 AST (部 分 节点 ) 








low: lladdr: b7cf5ce8 





为 了 分 析 GIMPLE 生 成 过 程 中 的 函数 调用 关系 ， 可 以 在 GCC 代码 中 相关 函数 的 入 口 和 出 口 处 增加 调试 语句 ， 将 函数 调用 的 过 程 输出 到 文件 gimplify-function-self modi 中 ， 并 通过 shell 程 序 对 该 文件 进 











行 处 理 ， 提 取出 的 函数 调用 过 程 为 : 























ССС 1оса1һовЕ gimplify]$ grep -E '{|}' gimplify-function-self modi | sed 's/\[[a-zA-2 =\ ]*\]// а! | sed 's/, <рге р [a-z 0 9a fx]*>// g' 
11 gimplify function tree | <fndecl@b7d84700> 
2] gimplify body { <body@b7d51190> 
31 gimplify Parameters ( /* 参数 处 理 开 始 */ 
3] } gimplify_parameters () /х 参数 处 理 结束 */ 
31 gimplify stmt ( <Біпа expr@0xb7d51190> /% 函数 体 的 GIMPLE 转 换 开 始 */ 
41 gimplify ехрг() { <bind expr@b7d51190> /* 第 一 次 调用 gimplify _ expr () */ 
521 gimplify ріпа expr () { <bind expr@0xb7d51190> /% BIND ) EXPR 的 转换 ж/ 
61 gimplify stmt ( <statement list@0xb7d8e8dc> 
71 gimplify expr() { <statement 1isteb7d8e8dc> 
81 gimplify statement list() ( <statement liste0xb7d8e8dc> 
/* 语句 列表 处 理 开始 */ 
91 gimplify stmt ( <decl expr@0xb7d024e0> 
/* 开始 转 扔 第 1 条 声明 语 自 int a=0; */ 
10 gimplify ехре() { <decl expr@b7d024e0> 
11 gimplify дес1 expr() { <decl expr@0xb7d024e0> 
12 gimplify stmt { <init ехрг00хо7сҒс678> 
13 gimplify expr() { <init expr@b7cfc678> 
14 gimplify modify expr() { <init expr@0Oxb7cfc678> 
15 gimplify expr() { <var decl@b7d8f000> 
/* 左 操 作 数 a 的 处 理 */ 
15 } gimplify ехрк() 
15 gimplify expr() ( <integer_csteb7cf5ccc> 
/ 右 操作 数 整数 常量 0 的 处 理 *A 
15 } gimplify expr () 
14 } gimplify modify ехрг () 
13 | gimplify expr() | 
12 } gimplify stmt 
11 } gimplify decl expr() 
10 } gimplify expr () 
91 } gimplify stmt /* 第 1 条 声明 语句 int a=0; 转换 结束 */ 
91 gimplify stmt { <десі expr@0xb7d02500> 
/* 开始 转换 第 2 条 声明 语句 int b; */ 
10 gimplify expr() { <decl expr@b7d02500> 
11 gimplify десі expr() { <decl expr@0xb7d02500> 
11 | gimplify десі expr() Е 
10 } gimplify ехрг () 
91 } gimplify stmt /* 第 2 条 声明 语句 int b; 转 换 结 束 */ 
91 gimplify stmt { <modify expr@Oxb7cfc60c> 
/ж 开始 转 授 第 3 条 语句 b=at+; */ 
10 gimplify expr() { <modify expr@b7cfc60c> 
11 gimplify modify expr() ( <modify expr@0xb7cfc60c> 
12 gimplify expr() { <var decl@b7d8f058> /* 左 操作 数 b */ 
12 } gimplify expr () 
12 gimplify expr() { <postincrement expr@b7cfc5e8> 
/* 右 操作 数 at+ */ 
13 gimplify self тоа ехрг() ( <postincrement expr@0xb7cfc5e8> 
14 gimplify expr() ( <var decl@b7d8f000> ~ 
14 } gimplify expr () 
14 gimplify expr() { <var decl@b7d8f000> 
14 } gimplify expr () 
14 gimplify stmt { <modify expr@0xb7cfc6c0> 
/% 后 副作用 a=a+1 的 转换 *x/ 
15 gimplify expr() { <modify expr@b7cfc6c0> 
16 gimplify modify expr() ( <modify expr@0xb7cfc6c0> 
17 gimplify expr() { <var decl@b7d8f000> 
17 | gimplify expr() 
gimplify expr() { <plus ехрг@р7сЁсб9с> 
18 gimplify expr() { <var decleb7d8f000> 
18 } gimplify expr() 
18 gimplify expr() { <integer cst@b7cf5ce8> 
18 } gimplify expr () 
17 } gimplify expr() 
16 | gimplify modify ехрг () 
15 } gimplify expr () 
14 } чішрііҒу віпе /* 后 副作用 a=a+1 的 转换 结束 */ 
13 } gimplify self поа expr() 
12 | gimplify expr() 7 
11 } gimplify modify expr() 
10 | gimplify expr() | 
91 } gimplify stmt /* 第 3 条 声明 语句 b=at+; 转 换 结束 */ 
9 1 gimplify stmt { <return ехрг@0хЫ7а02520> 
/* 开始 转 援 第 4 条 语句 return b; */ 
10 gimplify expr () ( <return expr@b7d02520> 
12 gimplify віше { <modify expr@0xb7cfc630> 
13 gimplify expr() { <modify expr@b7cfc630> 
14 gimplify modify expr() ( <modify expr@0xb7cfc630> 
15 gimplify expr() { <var decl@b7d8f0b0> 
15 } gimplify expr () 
15 gimplify expr() ( <var 4ес10Ь748Ғ058> 
15 } gimplify ехрк() 
14 | gimplify modify expr() 
13 } gimplify expr () 
12 } gimplify stmt 
11 } gimplify return_expr() 
10 } gimplify expr() ` 
91 } gimplify stmt /* 第 4 条 声明 语句 return bj; 转 换 结 束 */ 
81 } дішрііҒу statement list() /* 语 自 列表 处 理 结束 */ 
71 } gimplify ехрг () 
61 } gimplify stmt 
51 } дішрііғу bind expr /% BIND EXPR 转 换 结束 */ 
41 } gimplify ехрг () /* ®— 次 调用 的 gimplify | тазы %/ 
3] } gimplify_stmt /* 函数 体 的 GIMPIE 转 换 结束 F 
2-1 } gimplify body() 
1 ] } gimplify function tree () 


| sed 


's/\[// а" 


| sed '5/\]// а" 











注 : 每 行 开始 方 括号 中 的 数值 代表 的 是 函数 调用 的 深度 。 “{” 表 示 函 数 的 开始 ，“}” 表 示 函 数 的 结束 。 


可 以 注意 观察 处 理 节 点 的 地 址 ,与 图 


转换 结束 后 生成 的 GIMPLE 序 列 : 




















5-14 中 的 地 址 是 一 致 的 ， 从 中 可 以 发 现 AST 转 换 成 GIMPLE 的 过 程 中 对 AST 的 处 理 顺序 ， 也 可 以 与 图 5-9 对 照 分 析 。 














<&0xb7cfc654> [gimplify self modi.c : 6] Te bind < 


<&0xb7cef528> [gimplify : self modi. 
[gimplify self modi. 
[gimplify : self modi. 
<&0xb7cef5a0> [gimplify self modi. 
[gimplify : self 1 modi. 


<&0xb7cef564> 
<&0xb7d86280> 


<&0хЫ7а88а58> 


: 2] gimple assign <integer cst, aD.1232, 0, NULL> 
: 4] gimple assign <var десі, bD.1233, aD.1232, NULL> 
: 4] gimple assign <plus expr, aD.1232, aD.1232, 1> 
: 5] gimple assign <var decl, D.1234, bD.1233, NULL> 
: БІ gimple return <D.1234> 


(ret) 





5.9 小 结 


本 章 主要 介绍 了 GIMPLE 的 基本 概念 、 表 示 及 存储 等 内 容 ， 并 对 GIMPLE 的 生成 进行 了 详细 介绍 和 实例 分 析 。 


AST 到 GIMPLE 的 转换 以 函数 为 基本 单位 ， 以 gimplify_ function tree () 为 入 口 函数 ， 生 成 当前 函数 的 GIM PLE 序 列 。 





(1) 函数 gimplify body () 调用 





gimplify_parameters () 处 理 函 数 参数 的 转换 ; 





其 转换 的 主要 过 程 包括 : 
































(2) 函数 gimplify body () 调用 gimplify_stmt () 处 理 函 数 体 中 语句 的 转换 ，gimplify_stmt () 再 调用 gimplify_expr () ， 从 当前 函数 的 BIND_EXPR 表 达 式 开始 ， 依 次 处 理 函 数 体 语句 列表 中 的 每 
一 条 语句 的 转换 。 每 一 条 具体 语句 的 处 理 依然 调用 gimplify_stmt () ， 再 转换 成 gimplify expr () ， 然 后 根据 被 转换 的 表达 式 TREE_CODE 选 择 不 同 的 gimplify * 函 数 ， 完 成 该 表达 式 的 转换 ， 并 对 表达 式 
的 值 进行 处 理 。 























在 分 析 AST 到 GIMPLE 转 换 的 过 程 中 ， 需 要 对 以 下 内 容 进行 充分 了 解 : 








(1) AsT 的 结构 : 要 明确 一 个 函数 的 AST 结 构 中 各 个 节点 的 作用 及 其 相互 关系 ; 














(2) GIMPLE 转 换 的 部 分 递归 过 程 ; 
(3) GIMPLE 转 换 过 程 中 的 pre_p 和 post_p 的 深入 理解 ; 


(4) GIMPLE 转 换 过 程 中 对 原 有 AST 的 部 分 修改 。 


第 6 章 ”GIMPLE 处 理 及 其 优化 


本 章 首先 介绍 GCC 中 处 理 过 程 (Pass) 的 概念 ， 然 后 按照 G6CC 中 Pass 的 处 理 顺序 ， 对 几 个 重点 的 GIMPLE 相 关 处 理 进行 详细 介绍 。 由 于 基于 GIMPLE 中 间 表 示 的 处 理 和 优化 过 程 数 量 繁 多 ， 非 常 烦 杂 ， 
因此 本 章 主要 介绍 GIMPLE 处 理 的 基本 内 容 ， 并 对 函数 基本 块 (basic block) 的 生成 、 控 制 流程 图 (Control Flow Graph, CFG) 构造 、 函 数 调用 图 (Са! Graph，CGraph) 以 及 SSA (Static Single 
Assignment) 的 构造 等 几 个 常见 的 GIMPLE 处 理 稍 加 论述 ， 其 余 的 GIMPLE 处 理 及 优化 内 容 请 读者 自行 分 析 。 










































































6.1 GCC Pass 





GCC 在 完成 前 端的 词法 /语法 分 析 后 ， 获 得 了 源 代 码 相 对 应 的 抽象 语法 树 AST/GENERIC， 然 后 将 其 转换 为 对 应 的 GIMPLE 序 列 。 随 后 ，GCC 对 GIMPLE 中 间 表 示 形 式 进行 了 一 系列 的 处 理 ， 包 括 GIMPLE 
的 低级 化 (lowering) 、GIMPLE 优 化 以 及 RTL (Register Transfer Language) 生成 等 。 这 些 处 理 过 程 中 ， 尤 其 是 优化 处 理 纷繁 复杂 ， 为 了 便于 组 织 ，GCC 对 这 些 操作 使 用 一 种 称 为 Pass (本 书 称 为 “处 
理 过 程 ”) 的 管理 策略 。 也 就 是 说 ，GCC 将 这 些 处 理 划分 成 一 个 一 个 的 处 理 过 程 ， 每 个 处 理 过 程 完成 一 种 特定 的 处 理 ， 其 输出 结果 将 作为 下 一 个 处 理 过 程 的 输入 (有些 类 似 于 Unix/Linux 系 统 中 的 管道 处 理 
的 概念 ) 。 针 对 于 RTL 的 处 理 ，GCC 同 样 也 采用 了 Pass 的 管理 方式 ， 关 于 RTL 的 处 理 过 程 ， 将 在 第 11 章 中 进行 详细 描述 。 


















































6.2 ”Pass 列表 





在 GCC 中 有 大 量 的 代码 都 被 组 织 成 Pass， 包 括 GIMPLE 处 理 优化 、RTL 处 理 优化 及 汇编 代码 生成 等 功能 。 下 面 给 出 一 个 实例 ， 通 过 在 GCC 源 代码 中 增加 相应 的 调试 语句 ， 对 GCC 预 定义 的 3 个 Pass 链 进行 
人 遍历， 并 将 这 些 Pass 的 基本 信息 输出 ， 下 面 的 例子 中 只 给 出 了 Pass 的 名 称 及 其 类 型 ,读者 也 可 以 对 dump_opt_pass 函 数 进行 改写 ， 从 而 输出 更 完整 的 Pass 信 息 。 



































例 6-3 输出 GCC 中 预定 义 的 所 有 Pass 的 基本 信息 











首先 自 定义 一 个 函数 ， 用 来 输出 某 个 Pass 的 信息 。 











#include "gt-passes.h" 


char *pass type name[] -("СІМРІЕ РА55", "КТІ, PASS", "SIMPLE IPA PASS", "ІРА РА55"); 
void dump оре раѕэ (FILE *fp, struct opt раѕѕ *раѕѕ, int ident){ 





int i; 
struct opt pass *p; 
р = pass; 
while(p){ 
for(i=0; i<ident; 1++){ /* 打印 缩 进 符号 */ 





1Ғ(1%4--0) fprintf (fp, "|"); 
else if(i==ident-1) fprintf (Ёр, ">"); 
else if(i==ident-2) fprintf (Ёр, "-"); 
else if dent-3) fprintf (fp, "-"); 
else fprintf (Ёр, " "); 





fprintf (fp, " %-168 [35] \1", р->пате, pass буре папе[р->+уре]); 
/* 输出 Pass 的 名 称 及 类 型 信息 */ 
if(p->sub) dump_opt pass (fp, p->sub, ident+4); /% 递归 打印 子 Pass 信 息 %/ 
р = p->next; /% “т--ЖРавв */ 
} 








在 gcc/passes.c 的 init_optimization_passes 函 数 最 后 增加 如 下 代码 ， 可 以 打印 出 初始 化 的 passes 链 表 : 





fprintf (stdout, "а11 lowering passes\n") ; 
Яшпр оре pass (stdout, а11 lowering passes, 4); 
fprintf (stdout, "all іра passes\n"); 

dump_opt pass (stdout, а11 іра passes, 4); 
fprintf (stdout, "а11 passes\n"); 
dump_opt pass (stdout, а11 passes, 4); 





重新 编译 GCC 代码 ， 执 行 cc1 即 可 在 标准 输出 上 得 到 如 下 的 输出 : 


GCC@localhost gimplify]$ ~/paag-gcc/host-i686-pc-linux-gnu/gcc/ccl post р.с 
all lowering passes 





--> useless ІСІМРІЕ PASS] 
--> mudflapl [СІМРІЕ PASS] 
--> omplower [GIMPLE PASS] 
--> lower ІСІМРІЕ PASS] 
--> ehopt [GIMPLE PASS] 
--> eh [GIMPLE PASS] 
--> сід [СІМРІЕ PASS] 
--> cplxlower0 [GIMPLE PASS] 
--> veclower [GIMPLE PASS] 
--> (null) ІСІМРІЕ PASS] 
--> (па11) ІСІМРІЕ PRSS] 
--> (па11) [GIMPLE PASS] 


all іра passes 




























































































--> visibility ІБІМРІЕ ІРА РА55 
--> еіпііпе іра ІБІМРІЕ ІРА РА55 
--> еіпГіпе ІСІМРШЕ РА55 
--> (пи) ІСІМРІЕ РА55 
--> (null) ІСІМРІЕ РА55 
--> еагіу local cleanups [SIMPLE ІРА PASS] 
tree profile ІСІМРШЕ РА55 
cleanup cfg ІСІМРІЕ PASS 
(null) 7 ІСІМРШЕ РА55 
отрехр ІСІМРІЕ РА55 
(null) ІСІМРІЕ РА55 
(null) [GIMPLE_PASS 
ssa ІСІМРІЕ РА55 
(пи11) ІСІМРІЕ РА55 
--> еагіу optimizations [GIMPLE РА55) 
--> (null) СІМРІЕ РА55 
--> einline СІМРІЕ РА55 
--> copyrename СІМРІЕ РА55 
==. бср СІМРІЕ РА55 
--> forwprop СІМРШЕ РА55 
--> addressables СІМРІЕ РА55 
--> еѕга СІМРІЕ PASS 
--> соруркор СІМРІЕ РА55 
--> пегдерһі СІМРІЕ РА55 
--> cddce СІМРІЕ РА55 
--> sdse СІМРІЕ РА55 
--> tailr СІМРІЕ РА55 
--> Switchconv СІМРІЕ РА55 
--> Profile СІМРІЕ РА55 
ге1еаѕе ssa ІСІМРІЕ PASS 
> (null) ІСІМРІЕ РА55 
--> (па11) ІСІМРІЕ РА55 
--> increase alignment [SIMPLE ТРА PASS] 
--> matrix-reorg [SIMPLE ТРА РА55 
--> ср [IPA_PASS] 
--> inline [IPA_PASS] 
--> static-var [ІРА РА55] 
--> pure-const [ІРА РА55) 
--> type-escape-var |5ІМРІЕ ІРА РА55 
--> pta [SIMPLE ТРА РА55 
--> ipa_struct reorg [SIMPLE ТРА РА55 
а11 раѕѕеѕ 
--> (null) ІСІМРІЕ РА55) 
--> (па11) СІМРІЕ РА55 
> аддгеѕѕаріеѕ СІМРІЕ PASS 
> соругепапе СІМРІЕ РА55 
> cunrolli СІМРІЕ РА55 
> ccp СІМРІЕ РА55 
> forwprop СІМРШЕ РА55 
> сасе СІМРІЕ PASS 
--> alias СІМРІЕ PASS 
--> retslot СІМРІЕ РА55 
> рһіргор СІМРІЕ PASS 
> fre СІМРІЕ РА55 
--> соруркор СІМРІЕ РА55 
--> пегдерһі СІМРІЕ РА55 
> vrp СІМРШЕ РА55 
> Әсе СІМРІЕ PASS 
> cselim СІМРІЕ PASS 
> ifcombine СІМРІЕ РА55 
> СІМРІЕ PASS 
> СІМРІЕ РА55 
> СІМРІЕ РА55 
--> stdarg СІМРІЕ РА55 
--> cplxlower СІМРІЕ РА55 
> ѕга СІМРІЕ РА55 
> соругепапе СІМРІЕ РА55 
--> dom СІМРІЕ РА55 
--> Phicprop СІМРІЕ PASS 
> dse СІМРІЕ РА55 
> геаѕѕос СІМРІЕ РА55 
--> Әсе СІМРІЕ PASS 
--> forwprop СІМРІЕ PASS 
> рһіоре СІМРШЕ PASS 
> objsz GIMPLE PASS 
> ccp СІМРІЕ PASS 
> copyprop СІМРІЕ PASS 
> fab GIMPLE_PASS 
> sincos GIMPLE PASS 
> crited СІМРІЕ PASS 
pre СІМРІЕ PASS 
sink GIMPLE PASS 
loop GIMPLE PASS 
--> loopinit СІМРІЕ PASS 
--> соруркор СІМРІЕ РА55 
--> dceloop СІМРІЕ РА55 
--> lim СІМРІЕ РА55 
--> pcom СІМРІЕ РА55 
--> unswitch СІМРІЕ РА55 
--> всср GIMPLE РА55 
--> empty СІМРІЕ PASS 
--> (null) СІМРІЕ РА55 
--> скаа СІМРІЕ РА55 
--> ldist СІМРІЕ РА55 
--> ltrans СІМРІЕ РА55 
--> graphite СІМРІЕ РА55 
--> іусапоп СІМРІЕ РА55 
--> іісуе СІМРІЕ РА55 
--> vect СІМРІЕ РА55 
|--> veclower2 ІСІМРІЕ РА55) 
|--> dceloop ІСІМРІЕ РА55) 
--> cunroll СІМРІЕ РА55 
--> рагіоорв СІМРШЕ РА55 
--> aprefetch GIMPLE РА55 
--> іуорЕв СІМРІЕ РА55 
--> loopdone СІМРІЕ PASS 
гесір СІМРІЕ РА55 
rsqrt СІМРІЕ РА55 
reassoc СІМРІЕ РА55 
vrp СІМРІЕ PASS 
dom СІМРІЕ PASS 
phicprop СІМРІЕ РА55 
cddce СІМРІЕ РА55 
tracer СІМРІЕ РА55 
(null) СІМРІЕ PASS 
dse СІМРІЕ PASS 
forwprop GIMPLE_PASS 
phiopt СІМРШЕ PASS 
taile СІМРІЕ РА55 
соругепате СІМРІЕ РА55 
uncprop СІМРІЕ PASS 
--> optimized ІСІМРІЕ PASS] 
--> гү ІСІМРІЕ РА55) 
--> blocks ІСІМРІЕ РА55) 
--> final cleanup ІСІМРІЕ PASS] 
==> (пша11) ЇСІМРІЕ РАЅ5] 
--> (null) ІСІМРІЕ РА55) 
--> mudflap2 ІСІМРІЕ РА55) 
--> (null) ІСІМРІЕ РА55) 
--> ехрапа [ЕТІ PASS] 
--> (null) ІСІМРІЕ РА55) 
|--> (null) [RTL_PASS] 
sibling [RTL_PASS] 
eh [RTL_PASS] 
initvals [RTL_PASS] 
unshare [RTL_PASS] 
vregs [RTL_PASS] 
into cfglayout [RTL_PASS] 
jump [ЕТІ PASS] 























--> subregl [RTL РА55) 

--> dfinit [RTL PASS] 

--> csel [АТ PASS] 

--> fwpropl [RTL PASS] 

--> gcsel [АТ PASS] 

--> cel [RTL_PASS] 

--> 100р2 [АТ PASS] 
|--> 100р2 init ТАТІ, РА55] 
|--> 100р2 іпуагіапе (ЕТІ, PASS] 
|--> loop2 unswitch (ЕТІ. PASS] 
|--> loop2 unroll [RTL PASS] 
|--> 1оор2 ао1оор [АТ PASS] 
|--> loop2_done [RTL PASS] 

--> web Е ЕТІ, PASS 

--> bypass ЕТІ, РА55 

--> све2 RTL PASS 

--> dsel ЕТІ, РА55 

--> fwprop2 ЕТІ, PASS 

--> reginfo RTL PASS 

--> auto inc дес ЕТІ, РА55 

--> init-regs RTL РА55 

--> outof cfglayout [RTL PASS 

--> dce | RTL PASS 

--> combine ЕТІ, РА55 

--> се2 RTL РА55 

--> bbpart ЕТІ, РА55 

--> regmove RTL РА55 

--> split1 RTL РА55 

--> subreg2 ЕТІ, РА55 

--> dfinit RTL PASS 

--> (null) ЕТІ, РА55 

--> поде ѕи АТ РА55 

--> ѕее ЕТІ, РА55 

--> asmcons ЕТІ, PASS 

--> sms RTL РА55 

==> sched1 RTL РА55 

--> subregs of mode іпіс ТЕТІ, PASS 

--> ira ЕТІ, PASS 

--> subregs of mode finish [RTL PASS] 

--> (null) ЕТІ, РА55 
--> Postreload ТЕТІ, РА55 
--> дсве2 ЕТІ, РА55 
--> Split2 ЕТІ. РА55 
==> Ыс RTL PASS 
--> рко апа epilogue [RTL PASS 
--> dse? ` RTL PASS 
--> seqabstr ЕТІ. PASS 
--> сѕа ЕТІ, PASS 
--> peephole2 RTL PASS 
--> ce3 ЕТІ, PASS 
--> rnreg RTL PASS 
--> cprop_hardreg ЕТІ, PASS 
--> dce `~ RTL PASS 
--> bbro ЕТІ, РА55 
--> 512 RTL PASS 
--> (null) ЕТІ, РА55 
--> split4 RTL РА55 
--> sched2 ЕТІ, РА55 
--> (па11) RTL PASS 

|--> split3 ТЕТІ, PASS] 
|--> stack [RTL PASS] 

--> alignments ЕТІ, PASS 
--> compgotos ЕТІ, РА55 
--> vartrack RTL РА55 
--> (null) RTL РА55 
--> mach ЕТІ, PASS 
--> barriers RTL РА55 
--> dbr ЕТІ, РА55 
--> split5 RTL PASS 
--> еһ гапдеѕ ЕТІ, РА55 
--> shorten RTL РА55 
--> (null) ЕТІ, РА55 
--> (па11) ЕТІ, PASS 

--> dfinish [RTL РА55] 

--> (па11) [RTL_ PASS] 





可 以 看 出 ，GCC 中 的 Pass 数 目 众多 ， 完 成 了 大 量 的 GIMPLE 低 级 化 、GIMPLE 优 化 、RTL 生 成 、RTL 优 化 以 及 汇编 代码 生成 等 内 容 ， 是 GCC 核心 代码 一 种 有 效 的 组 织 方式 。 注 意 输出 中 有 些 Pass 的 名 称 为 
(пи!) ， 表 示 该 Pass 在 GCC 内 部 没有 给 出 名 称 ， 因 此 输出 为 空 。 这 些 Pass 的 具体 作用 请 查阅 文献 GCCinternal。 















































下 面 的 章节 将 对 GIMPLE 处 理 中 的 几 个 代表 性 的 Pass 进 行 描述 ，RTL 处 理 过 程 在 第 11 章 中 介绍 ， 其 余 的 请 读者 自行 分 析 代 码 中 的 详细 实现 过 程 。 























6.3 GIMPLE Pass 实 例 








前 端 语言 的 AST 转 换 成 GIMPLE 中 间 表 示 之 后 ，GCC 使 用 了 大 量 的 GIMPLE 处 理 过 程 对 GIMPLE 中 间 表示 进行 了 处 理 ， 包 括 从 高 级 GIMPLE 转 换 成 低级 GIMPLE、1PA 处 理 、GIMPLE 优 化 ， 以 及 最 终 由 
GIMPLE 生 成 RTL 等 ， 在 GCC 4.4.0 中 大 概 包 括 130 个 基于 GIMPLE 的 处 理 过 程 (包括 GIMPLE 处 理 过 程 和 PA 处理 过 程 ) ， 也 包括 了 80 多 个 基于 RTL 的 处 理 过 程 。 本 节 主 要 介绍 其 中 的 去 除 无 用 代码 、 降 低 控 
制 流 、 创 建 控制 流 图 (Control Flow Graph, CFG) 、 建 立 函数 调 (Call Graph, CG) 及 构造 SSA 等 几 个 GIMPLE 处 理 过 程 ，RTL 处 理 过 程 参见 第 11 章 RTL 处 理 及 优化 。 
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64 小 结 














本 章 主要 介绍 了 GCC 中 处 理 过 程 Pass 的 基本 概念 ， 包 括 Pass 的 分 类 、 基 本 数据 结构 及 其 组 织 方式 ， 并 对 基于 GIMPLE 中 间 表 示 的 GIMPLE_PASS 中 关键 的 几 个 处 理 过 程 进 行 了 简单 的 介绍 。 


第 7 章 RTL 











GIMPLE 是 一 种 与 前 端 编程 语言 无 关 也 与 目标 机 器 无 关 的 中 间 表 示 形 式 ， 而 目标 机 器 所 支持 的 汇编 语言 则 是 与 目标 机 器 紧密 相关 的 。 如 何 将 与 机 器 无 关 的 GIMPLE 中 间 表 示 转 换 成 与 机 器 相关 的 汇编 语 
言 ， 是 GCC 后 端 处 理 的 主要 任务 之 一 ， 也 是 GCC 支持 多 目标 机 器 的 基础 。 









































为 了 完成 上 述 功能 ，GCC 中 引入 了 寄存 器 传输 语言 (Register Transfer Language, RTL) 。RTL 采 用 了 类 似 LISP 语 言 的 列表 形式 ， 描 述 了 每 一 条 指令 的 语义 动作 。 根 据 其 作用 ，RTL 可 以 分 为 两 大 类 : 























(1) 内 部 格式 (Internal Form) : 这 种 格式 通常 由 GIMPLE 转 化 而 成 ， 是 程序 代码 的 另外 一 种 中 间 表 示 形 式 ， 可 以 称 为 IR-RTL (Intermediate Representation RTL) ; 


























(2) 文本 格式 (Textual Form) : 用 于 机 器 描述 (Machine Description) 文件 中 ， 进 行 机 器 描述 时 所 采用 的 RTL 形 式 ， 可 以 称 为 MD-RTL (Machine Description ЕТІ) , 














GIMPLE 中 间 形 式 在 转化 成 IR-RTL 时 ， 会 按照 G6CC 设 计时 所 定义 的 规则 ， 将 每 个 GIMPLE 语 句 转换 成 具有 某 个 标准 模板 名 称 (Standard Pattern Name, SPN) 对 应 的 RTL， 该 转换 规则 是 与 机 器 无 关 
的 。 从 MD-RTL 来 看 ， 某 个 标准 模板 名 称 所 定义 的 指令 模板 则 是 与 机 器 相关 的 ， 对 于 不 同 的 机 器 ， 其 实现 的 内 容 也 是 各 不 相同 的 ， 但 从 IR-RTL 来 看 ， 这 些 标准 模板 名 称 所 对 应 的 操作 语义 则 是 与 机 器 无 关 
的 。 正 是 因为 采用 了 标准 模板 名 称 ， 通 过 将 GIMPLE CODE 和 MD-RTL 中 具有 标准 模板 名 称 的 指令 模板 进行 匹配 ， 从 而 实现 机 器 无 关 的 GIMPLE 表 示 到 机 器 相关 的 RTL 之 间 的 转换 。 因 此 ， 在 使 用 MD-RTL 描 
述 目标 机 器 特性 时 ， 必 须 定义 这 些 标准 模板 名 称 所 对 应 的 指令 模板 。 关 于 标准 模板 名 称 的 描述 详 见 8.2.1 节 。 




























































































图 7-1 给 出 了 RTL 与 GIMPLE 以 及 目标 机 器 汇编 代码 之 间 的 关系 ， 涉 及 GIMPLE 到 RTL 的 转换 、 机 器 描述 以 及 RTL 到 汇编 代码 的 生成 等 关键 问题 。MD-RTL 主 要 用 来 描述 目标 机 器 的 指令 模板 ， 其 中 具有 标 
准 模式 名 称 (Standard Pattern Name, SPN) 的 指令 模板 用 来 指导 IR-RTL 的 构造 ， 从 而 实现 机 器 无 关 的 GIMPLE 到 机 器 相关 的 IR-RTL 的 转换 。 在 由 IR-RTL 生 成 目标 机 器 汇编 代码 时 ， 将 进一步 依据 MD- 

RTL 中 所 定义 的 所 有 指令 模板 ， 完 成 IR-RTL 到 指令 模板 的 匹配 ， 并 根据 匹配 指令 模板 中 的 汇编 代码 输出 格式 生成 汇编 代码 。 可 以 看 出 ， 标 准 指令 模板 名 称 对 于 IR-RTL 的 构造 具有 非常 重要 的 意义 ， 是 完成 机 
器 无 关 的 GIM PLE 到 机 器 相关 的 RTL 转 换 的 重要 依据 ， 也 是 将 机 器 相关 的 汇编 代码 与 机 器 无 关 的 GIM PLE 进 行 分 离 的 重要 媒介 ， 从 而 使 得 GCC 的 中 间 处 理 与 具体 的 目标 机 器 特性 隔离 ， 便 于 GCC 完成 对 多 种 目 
标 机 器 的 支持 。 


GIMPLE 





































































































其 他 指令 模板 





图 7-1 RTL 与 GIMPLE、 汇 编 代 码 之 间 的 关系 


本 章 将 介绍 RTL 的 基本 概念 、RTL 的 表示 方法 及 存储 结构 ， 第 8 章 和 第 9 章 将 介绍 机 器 描述 ， 第 10 章 将 介绍 GIMPLE 到 RTL 的 转换 过 程 ， 第 11 章 则 介绍 RTL 到 汇编 代码 的 生成 过 程 。 


7.1 “RTL 中 的 对 象 类 型 





RTL 中 间 表 示 中 包括 五 种 对 象 类 型 (Object Туре) ， 分 别 是 表达 式 (Expression) 、 整 数 (Integer) 、 宽 整数 (Wide Integer) 、 字 符 串 (String) 和 向 量 (Vector) 。 




















整数 就 是 一 个 类 型 为 int 的 简单 类 型 ， 宽 整数 的 数据 类 型 是 HOST_ WIDE _INT。 字 符 串 的 定义 与 C 语 言 中 的 定义 类 似 。 向 量 可 以 包含 任意 数量 的 RTX 表达 式 。 

















RTL 中 的 表达 式 也 称 为 RTX (RTL eXpression) ， 它 是 RTL 中 最 重要 的 一 类 对 象 。 根 据 RTX 表 达 式 语义 的 不 同 ，GCC 定 义 了 众多 的 RTX 代码 (RTX_CODE) ， 可 以 通过 GET CODE (х) 和 
PUT_ CODE (х) 获取 和 设置 RTX x 的 代码 。 需 要 强调 的 是 ，RTX_CODE 所 表达 的 语义 是 机 器 无 关 的 。RTX_CODE 与 TREE CODE, СІМРІЕ CODE 类 似 ， 分 别 是 RTX 表达 式 、TREE 节 点 及 GIMPLE 语 名 的 语 


义 标识 。 

















RTX 的 声明 在 gcc/rtl.def 中 使 用 宏 定 义 的 方式 进行 描述 ， 形 式 为 : 





DEF_RTL EXPR(RTL CODE, NAME, PRINT FORMAT, RTX CLASS) 


























上 述 声 明 包括 四 个 部 分 ， 分 别 为 RTL CODE、NAME、PRINT_FORMAT 及 RTX_CLASS。 其 中 RTL_CODE 表 示 该 RTX 的 标识 ， 即 RTX_CODE， 这 些 值 在 enum rtx_code 枚 举 类 型 中 定义 ; NAME 为 输出 
该 RTX 时 的 外 部 ASClI 字 符 串 ， 这 些 值 在 rtx_name[ 字 符 串 数组 中 定义 ; PRINT_FORMAT 描 述 了 该 RTX 操作 数 的 输出 格式 ， 同 时 也 描述 了 这 些 操作 数 的 类 型 ， 这 些 字符 串 格式 在 rtx_format[ 数 组 中 定义 ; 
RTX_CLASS 则 描述 了 RTX 的 分 类 类 型 ， 这 些 类 型 在 enum rtx_class 枚 举 类 型 中 定义 。 








例如 : 


DEF ВТ EXPR(GE, "де", "ее", RTX COMPARE) 

















该 定义 声明 了 一 个 表示 “大 于 或 等 于 ”语义 的 RTX 表达 式 ， 该 RTX 表达 式 的 RTX_CODE 为 GE， 输 出 字符 串 名称 为 “ge” ， 类 型 为 RTX_COMPARE， 其 中 “ee” 为 RTX 中 操作 数 的 输出 格式 。 





下 面 的 章节 就 对 RTL 的 类 型 、 输 出 格式 、 操 作 数 等 内 容 进行 详细 的 分 析 。 





7.2 RTX CODE 


RTX_CODFE 是 RTX 表达 式 的 语义 表达 ， 也 是 RTX 的 标识 ，RTX_CODE 的 合法 取 值 在 enum rtx_code 枚 举 类 型 中 定义 ， 其 定义 如 下 : 


#define RTX CODE enum rtx code 

enum rtx code { 

#define ПЕЕ RTL EXPR (ENUM, NAME, FORMAT, CLASS) ENUM ， 
#include "rtl.def" 

#undef DEF ЕТІ. EXPR 

LAST АМО UNUSED RTX CODE 

1; 





该 定义 通过 宏 定 义 展开 后 就 生成 : 





enum гіх code{ 

UNKNOWN ~ 

EXPR_LIST 

INSN_LIST 

SEQUENCE 

ADDRESS 

INSN 

JUMP_INSN 

CALL INSN 

BARRTER 

/ж 限于 篇 幅 ， 省 略 大 量 代码 */ 
ІАЅТ АМО UNUSED RTX CODE 
}; 





7.3 RTX 类 型 





每 种 不 同 代码 (RTX_CODE) 的 RTX 可 以 表达 不 同 的 语义 。 根 据 其 语义 的 不 同 ，RTX 可 以 分 成 如 下 几 种 类 型 ( 称 为 RTX CLASS) ， 定 义 在 rtl.h 中 ， 注 释 中 给 出 了 较 详细 的 解释 。 








/% Register Transfer Language EXPRESSIONS CODE CLASSES %/ 
enum rtx class { 


/к 0 х/ 

ВТХ СОМРАВЕ, /% 非 对 称 的 比较 ， 例 如 LT、GEU 等 */ 

RTX_COMM СОМРАВЕ, /* 对 称 的 比较 ， 例 如 EQ、ORDERED 等 %/ 

RTX_BIN ARITH, /* 不 可 交换 的 双 目 运算 ,例如 MINUS、DIV、ASHIFTRT 等 */ 

RTX COMM ARITH, /* 可 交换 的 双 目 运算 ， 例如 PLUS、AND 等 */ 
{ка жү 

RTX_UNARY, /* 单 目 算数 操作 ,例如 NEG、NOT、ABS 等 */ 

RTX_EXTRA, /* 其 他 */ 

RTX MATCH, /* RTX 代 码 中 的 匹配 条 件 ， 例 如 MATCH_DUP 等 */ 

RTX_INSN, /* RTX 代 码 ， 例 如 INSN、JUMP_INSN、 CALL INSN 等 */ 
/ж 8 жу 

RTX_OBJ, /* 实际 的 对 象 ， 例 如 寄存 器 或 者 内 存 地 址 */ 


RTX_CONST_OBJ, 
RTX_TERNARY, 

RTX_BITFIELD ОРЅ, 
RTX_AUTOINC /* 自 增 运算 ,例如 POST_INC 等 */ 


/* 常量 对 象 ， 包 括 HIGH */ 
运算 ， 例如 IF_THEN ELSE */ 











np 


可 以 使 用 GET_RTX_CLASS (code) 来 获取 RTX_CODE 为 code 的 RTX 所 对 应 的 类 型 (CLASS) 。 


命令 可 以 列 出 所 有 的 RTX_OBJ 类 型 及 RTX_CONST_OBJ 类 型 的 RTX。 


另外 ， 也 可 以 使 用 








Linux 的 shell 工 具 从 rtl.def 文 件 中 查看 某 种 RTX_CLASS 所 包含 的 RTX。 例 如 ， 使 











如 下 











[GCC@localhost paag-gcc] $ grep ^DEF_RTL EXPR gcc/rtl.def 
DEF RTL EXPR (CONST_INT, "const_int", "и", RTX CONST OBJ) 
DEF RTL EXPR (CONST_FIXED, "const_fixed", "www, RTX CONST OBJ) 
DEF RTL EXPR (CONST DOUBLE， "const double", CONST DOUBLE FORMAT, RTX CONST OBJ) 
DEF RTL EXPR (CONST VECTOR, "const vector", "Е", RTX CONST OBJ) 


DEF RTL EXPR (CONST { _ STRING, "const string", "s", RTX ОВ) | 


ПЕК RTL EXPR CONST, "const", "e", RTX_CONST_OBJ) 
DEF КТІ EXPR(PC, "рс", "", RTX OBJ) 
DEF RTL EXPR VALUE, "value", "0", RTX OBJ) 
DEF RTL EXPR(REG, "reg", "i00", RTX OBJ) 
"scratch", "0", RTX OBJ) 
DEF ЕТІ, ЕХРЕ(СОМСАТ, "concat", "ee", RTX OBJ) 
DEF RTL EXPR (CONCATN, косак", "Е", RTX OBJ) 
DEF RTL EXPR "mem", "e0", RTX OBJ) ` 
DEF RTL EXPR (LABEL REF, лабе] теѓ", RTX_CONST ОВЈ) 






ПЕР ЕТІ. EXPR (SYMBOL КЕР, 
DEF ЕТІ. ЕХРЕ(ССО, "сс0", 
DEF RTL ЕХРЕ(НІСН, "high", "е", 
DEF RTL EXPR(LO_ SUM, "lo_sum", 


"symbol_ref", 
"", RTX OBJ) 
RTX_CONST_OBJ) 
ее", RTX_OBJ) 


500", RTX_CONST_OBJ) 


( 
( 
( 
( 
( 
( 
| 
DEF RTL EXPR (SCRATCH, 
( 
( 
(МЕМ, 
( 
( 
( 
( 
( 


| grep -E 'RTX OBJ|RTX CONST OBJ' 

















同样 ， 如 果 需 要 了 解 哪些 RTX 属于 RTX_COMPARE 类 型 ， 可 以 使 用 如 下 命令 : 








GCC@localhost$ grep “БЕР 1 RTL EXPR gcc/rtl.def 
DEF ВТ1, EXPR(GE, "ge", "ее", RTX_ COMPARE) 
DEF RTL EXPR (GT, ‚ "ее", RTX COMPARE) 
ПЕК RTL EXPR "єт, "ее", RTX COMPARE) 
ПЕР RTL EXPR (LT, е", RTX COMPARE) 


| grep RTX_COMPARE 





DEF RTL EXPR (GEU, "geu", "ее", RTX_ COMPARE) 
ПЕК ЕТІ, EXPR (GTU, "gtu", "ee", RTX COMPARE) 

"leu", "ее", RTX_ COMPARE) 
ПЕК RTL EXPR (LTU, "ltu", "ee", RTX COMPARE) 


DEF RTL EXPR(UNGE, "unge", "ее", RTX_ COMPARE) 
DEF_RTL_EXPR (UNGT, "ungt", "ee", RTX_COMPARE) 
DEF_RTL_EXPR (UNLE, "unle", "ее", RTX_COMPARE) 


( 
(ҺЕ 
( 
( 
“ЕТІ ЕХРК( 
DEF ЕТІ. EXPR (LEU, 
( 
( 
( 
( 
( 


DEF ЕТІ, EXPR(UNLT, "unlt", "ее", RTX СОМРАВЕ) 





7.4 RTX 输出 格式 





在 GCC 的 运行 和 调试 过 程 中 ， 有 时 候 需要 输出 RTX 的 内 容 ， 











在 rtl.c 中 有 如 下 定义 : 


此 需要 定义 RTX 操 作 数 的 输出 格式 。 这 些 输 出 格式 使 用 字符 














中 的 每 个 字符 定义 了 该 RTX 中 对 应 的 每 一 个 操作 数 的 输出 格式 。 





#undef DEF RTL EXPR 

/* 以 RTX CODE 为 索引 ， 定 义 了 RTX 各 个 操作 数 的 输出 格式 */ 
const char * const гіх format[NUM RTX CODE] = { 
#define DEF RTL ЕХРЕ(ЕМОМ, МАМЕ, FORMAT, CLASS) 
#include "rtl.def" 

#undef DEF RTL EXPR 

1; 


FORMAT , 





该 宏 定义 经 过 预 处 理 展开 后 ， 形 成 如 下 内 容 : 





const char * const гіх format [МОМ RTX CODE] = { 


тже, /* RIX CODE = UNKNOWN */ 
"ее", /* RTX CODE = EXPR LIST */ 
"ue", /* RTX CODE = INSN LIST */ 
"Е", /* ВТХ CODE = SEQUENCE */ 
"е", /* RTX CODE = ADDRESS %/ 
"iuuBieie", /* RTX CODE = INSN */ 
"iuuBieie0", /* RIX CODE = JUMP INSN */ 
"iuuBieiee", /* RTX CODE = CALL INSN */ 


"iuu00000"， /% RTX CODE = BARRIER */ 


"iuuB00is"， /% RTX CODE = CODE LABEL */ 
"iuuBOni", /* RTX CODE = КОТЕ */ 

"ее", /% RTX CODE = COND EXEC */ 
"Е", /* RTX CODE = PARALLEL */ 
"ати; /% RTX CODE = ASM INPUT */ 
"ssiEEi", /* RTX_CODE = ASM OPERANDS */ 


"Еі", /% ВТХ СОрЕ = UNSPEC */ 
/ж 限于 篇 幅 ， 省 略 后 续 的 内 容 */ 
} 





可 以 看 出 该 结构 体 以 RTX_CODE 为 索引 ， 存 储 了 各 种 RTX 表达 式 中 每 个 操作 数 的 输出 格式 。 从 数组 元 素 的 字符 








有 值 也 可 以 获得 对 应 RTX 的 操作 数 个 数 ， 也 就 是 该 RTX 的 输出 格式 字符 串 的 长 度 。 例 如 : 








ССС@1оса1ћоѕі$ grep ^DEF RTL EXPR gcc/rtl.def | grep PLUS 


DEF_RTL EXPR (PLUS, "plus™, "ее", RTX COMM ARITH) 
DEF RTL EXPR (SS_PLUS, "ss_plus", "ее", RTX COMM ARITH) 
DEF RTL EXPR (US_PLUS, "изв plus", "ее", RTX_COMM ARITH) 








可 以 看 出 RTX_CODE 为 PLUS 的 RTX 属于 可 交换 的 双 目 运算 类 型 的 RTX， 其 类 型 为 RTX_COMM_ARITH。 另 外 ， 该 RTX 有 两 个 操作 数 ， 对 应 的 输出 格式 为 “ee” ， 表 示 该 RTX 的 两 个 操作 数 是 RTL 表 达 


。 这 两 个 操作 数 输出 时 均 按照 RTL 表 达 式 的 格式 输出 。 


再 例 : 





ССС@1оса1ћоѕі$ grep “^DEF RTL EXPR gcc/rtl.def | grep POST ПЕС 


DEF _RTI EXPR(POST ПЕС, "ров дес", "е", RTX AUTOINC) 











可 以 看 出 POST_DEC 是 自 减 运算 ， 属 于 单 目 运算 ， 其 操作 数 只 有 一 个 RTX， 输 出 格式 为 “e”。 


表 7-1 给 出 了 常见 的 输出 格式 字符 所 代表 的 意义 。 


* 未 定义 
0 该 操作 数 未 使 用 
整数 操作 数 


表 7-1 


RTX 常 用 格式 字符 的 意义 及 输出 格式 


输出 格式 


输出 时 会 给 出 一 个 警告 信息 


[бу 





宽度 为 HOST BITS РЕВ WIDE ІМТ 位 的 整数 操作 数 输 ! 





п 整数 操作 数 
w 
5 字符 串 操作 数 


u 指向 INSN 的 指针 操作 数 
B 基本 块 指针 操作 数 

t 树 节点 指针 操作 数 

E RTX 向 量 指针 操作 数 














使 用 GET_RTX_LENGTH (code) 可 以 获取 RTX_CODE 为 code 的 RTX 的 操作 数 个 数 ， 使 














GET_RTX_FORMAT (code) 可 以 获取 RTX_CODE 为 code 的 RTX 的 输出 格式 字符 串 。 


e RTX 操作 数 RTX 表达 式 


输出 insn 的 UID 
基本 块 信息 

树 节点 信息 
RTX 向 量 








7.5 RTX 操作 数 





RTX 表达 式 可 以 有 操作 数 ， 不 同 的 RTX 具有 的 操作 数 个 数 和 类 型 也 是 各 不 相同 的 。RTX 操 作 数 的 对 象 类 型 可 以 是 RTX、 整 数 、 宽 整数 、 字 符 串 或 向 量 。 


RTX 操作 数 的 个 数 和 类 型 可 以 从 该 RTX 的 PRINT_FORMAT 字 符 串 中 获取 。 其 中 操作 数 的 个 数 为 该 PRINT_FORMAT 字 符 虽 








的 长 度 ， 每 个 操作 数 的 类 型 则 由 字符 串 中 对 应 的 字符 来 描述 。 例 如 : 








DEF RTL EXPR(PLUS, "plus", "ее", RTX СОММ RARITH) 





可 以 得 出 ，RTX_CODE 为 PLUS 的 RTX 的 PRINT_FORMAT 字 符 串 为 “ee”， 因 








均 为 RTX。 





如 果 需 要 获取 某 个 RTX 的 操作 数 ， 可 以 使 
的 操作 数 等 。 在 gcc/rtl.h 中 有 如 下 定义 : 

















此 ， 该 RTX 具有 两 个 操作 数 ， 分 别 记 为 op0 和 op1。 其 中 op0 和 op1 的 类 型 均 由 字符 “e” 给 出 ， 表 示 这 两 个 操作 数 的 类 型 

















XEXP、XINT、XWINT、XSTR 及 XVEC 等 宏 定 义 ， 其 区 别 在 于 所 获取 的 操作 数 的 类 型 不 同 ， 例 如 XEXP 用 来 获取 类 型 为 RTX 的 操作 数 ，XINT 用 来 获取 类 型 为 int 


























#define XINT (RTX, N) (ЕТІ. СНЕСК2 (RTX, М, 'i', 'n').rt_int) 
#define XSTR(RTX, М) (ЕТІ. CHECK2 (RTX, М, 's', 'S').rt str) 
#define XEXP (RTX, N) (ЕТІ. CHECK2 (RTX, М, 'е', 'u').rt гіх) 
#define XVEC (RTX, М) (ЕТІ. СНЕСК2 (RTX, М, 'E', 'V').rt rtvec) 





而 RTL CHECKC2(RTX，N，C1，C2) 的 定义 如 下 : 





#if defined ENABLE КТІ CHECKING && (ОСС VERSION >= 2007) 
/* 定义 了 ENABLFE RTL CHECKING 及 GCC 版 本 满足 要 求 */ 


#define КТІ СНЕСКС2 (RTX，N，C1，C2) extension 
(*({ _ typeof (RTX) сопзі гіх = (RTX); const int п = (М); 
const enum гіх code code = СЕТ CODE ( гіх); 
if ( code != (СІ) 66 code !- (С2)) ` 
rtl check failed соде2 ( гіх, (C1), (C2), FILE , LINE , 
Sr Е Z FUNCTION); T O Too 一 


&_rtx->u.fld[_n]; })) 


#else /* ЕМАВІЕ RTL CHECKING 未 定义 或 者 GCC 版 本 不 满足 要 求 */ 


#define ЕТІ. CHECK2 (RTX, М, СІ, C2) 
#endif 


( (RTX) ->u. f1d [N] ) 


一 一 一 一 一 一 





可 以 看 出 ， 在 RTL_ CHECKC2 宏 定义 中 ， 如 果 定 义 了 ENABLE_RTL_ CHECKING 且 GCC 的 版 本 符合 要 求 ， 则 返回 RTX 的 第 N 个 操作 数 (В (АТХ) ->u.fld[N]) 之 前 需要 进行 类 型 的 检查 ， 和 否则 


RTL_CHECK2 直 接 将 RTX 中 第 N 个 操作 数 返 回 。 





需要 注意 的 是 ，RTX 操 作 数 的 编号 也 是 从 0 开始 的 。 





在 获得 该 操作 数 后 ， 再 根据 该 操作 数 的 对 象 类 型 将 相应 的 值 提 取出 来 。 例 如 ， 如 
>u.fld[N]) .rt_str。 





例如 ， 对 于 XINT (rtx，0) ， 首 先 展开 为 (RTL_CHECK2 (rtx，0, 1, 'n') .rt_int) ， 再 根据 RTL_CHECK2 的 宏 定义 ， 进 一 步 进行 




















果 是 整数 ， 该 操作 数 的 值 为 ( (АТХ) ->u.fld[N]) .rt_int， 如 果 是 字符 捉 ， 则 该 操作 数 的 值 为 ( (АТХ) - 





展开 。 





(1) 如 果 定 义 了 ENABLE RTL CHECKING 及 GCC 版 本 满足 要 求 ， 则 展开 为 : 
__ехіепѕіоп 3% 
(*({ 
_ typeof (rtx) const гіх = (rtx); 
const int n= (0); қ 


const enum rtx code code = СЕТ CODE ( гех); \ 
if (code != (747) && соде != ( ‘п’ )) \ 
rtl Check failed сойе2 ( тех, (47), (‘n’), ЕПШЕ , LINE ， 
_FUNCTION ); 一 Е Е ЗЕЕ 
8 rtx->u.fld[_n]; 

} 
) ) 


:rt int 














(2) 如 果 ENABLE RTL CHECKING 未 定义 或 者 GCC 版 本 不 满足 要 求 ， 则 展开 为 : 





((Ftx)->u.fld[0]) .rt int 











而 对 于 宽 整数 操作 数 的 获取 ，GCC 定 义 的 宏 定义 为 XWINT， 其 定义 如 下 : 





#if defined ENABLE ЕТІ. CHECKING 88 (ОСС VERSION >= 2007) 
#define XWINT (RTX, N) extension 
(*({ _ typeof (RTX) const гіх = (АТХ); const int п = (М); 
const enum rtx code code = GET CODE ( rtx); 
if (n<0 || п >= СЕТ ВТХ LENGTH (_code)) 
гії check failed bounds (гіх, пу _FILE , ІШІМЕ , 
FUNCTION ); 
(СЕТ RTX FORMAT( сое) [ п] != 'w') | 
rtl check failed typel ( гіх, п, 'м', FILE , LINE , 
Е т Е L FUNCTION ) 0007007 


if 


i E A 


&_rtx->u.hwint[_n]; })) 
#else | T 
#define XWINT (RTX, N) 

#endif 


( (RTX) ->u.hwint [N] ) 


与 整数 、 字 符 














以 上 几 个 宏 定 义 都 使 
第 2 操作 数 op2， 








两 个 参数 : 一 个 是 RTX 指针 ; 一 个 是 操作 数 编号 (从 0 开始 计算 ) 。 例 
该 操作 数 是 一 个 整数 。 



































串 等 操作 数 的 获取 方法 相同 ， 不 同 的 是 在 获取 宽 整 数 操作 数 时 ， 增 加 了 边界 检查 和 类 型 检查 。 


如 ，XEXP (х, 2) 就 获取 RTX x 的 第 2 操作 数 op2， 且 该 操作 数 是 一 个 RTX。XINT (х, 2) 就 获取 RTX x 的 








需要 注意 的 是 ， 任 何 操作 数 都 允许 以 整数 、RTX 表 达 式 或 者 字符 串 的 形式 进行 访问 。 实 际 使 




















数 ， 从 而 使 








适当 的 宏 定 义 、 操 作 数 编号 以 及 操作 数 类 型 。 


例如 ， 对 于 DEF_RTL_EXPR (PLUS, 
RTX) ， 因 此 访问 第 0 个 操作 数 时 应 该 使 


"plus", 
































同样 ， 对 于 DEF_RTL_ EXPR (РОЅТ РЕС, "post_dec", 
XEXP (х, 1) 操作 则 是 无 意义 的 ， 








因为 该 表达 式 并 没有 第 1 操作 数 。 











对 于 DEF_RTL EXPR (SUBREG, "subreg", "ei", RTX_EXTRA) 来 说 ， 第 0 操作 数 的 输出 类 型 为 “e”， 正 确 的 访问 方式 为 XEXP (x，0) ; 第 1 操作 数 输 出 类 型 为 “” ， 即 整数 ， 因 





的 访问 方式 应 该 为 XINT (х, 1). 


对 于 向 量 操作 数 的 访问 稍微 复杂 一 些 。XVEC (x, index) 获取 RTX x 的 第 index 个 操作 数 ， 并 返 


"ee", RTX СОММ АКІТН) 所 定义 的 RTX 来 说 ， 可 以 看 出 该 RTX 表达 式 包含 两 个 操作 数 ， 
ХЕХР (х, 0) ， 访 问 第 1 个 操作 数 时 应 该 使 用 XEXP (x，1) 。 


"e", RTX_AUTOINC) 来 说 ， 该 RTX 表 达 式 只 有 一 个 操作 数 ， 操 作 数 输出 类 型 为 “e”， 


时 ， 需 要 根据 该 RTX 的 RTX_CODE 及 PRINT_FORMAT 字 符 串 ， 判 断 该 RTX 操作 数 的 类 型 以 及 操作 数 的 个 














操作 数 的 输出 类 型 均 为 “e” (表明 该 RTX 的 两 个 操作 数 均 为 














因此 访问 第 0 操作 数 时 应 该 使 有 














ХЕХР (x, 0) ,而 








此 第 1 操作 数 正确 











回 











一 个 向 量 指针 ; XVECLEN (х, index) 获取 RTX x 的 第 index 个 操作 数 (向 量 ) 的 向 量 长 度 ， 即 该 向 量 








中 元 素 的 个 数 ; XVECEXP (x, index, eltnum) 获取 RTX x 的 第 index 个 操作 数 (向 量 ) 中 的 第 eltnum 个 元 素 ， 该 元 素 的 返 


XVECLEN (x, index) ， 即 该 向 量 的 长 度 。 


7.6 ”RTX 的 机 器 模式 








机 器 模式 表示 在 机 器 
目标 机 器 所 支持 。 另 外 ， 




















E] 





值 类 型 为 RTX 指针 。 注 意 ， 元 素 索 引 eltnum 的 值 必须 为 非 负 值 ， 且 小 于 





层次 上 数据 的 大 小 及 其 格式 。 每 个 RTX 均 有 其 机 器 模式 的 描述 。 一 般 来 说 ， 在 gcc/machmode.def 文 件 中 定义 了 GCC 中 默认 所 支持 的 所 有 机 器 模式 ， 这 些 机 器 模式 能 被 绝 大 多 数 的 
户 也 可 以 在 config/${target}/${target}-modes.def 中 定义 与 特定 目标 机 器 相关 的 机 器 模式 ， 











中 $f{target} 表 示 目 标 机 器 的 名 称 。 




















gcc/machmode.def 文 件 的 内 容 会 包含 在 gcc/genmodes.c 文 件 中 ， 并 以 宏 定 义 调 | 











的 方式 使 用 。 

















这 些 宏 定义 及 其 意义 如 表 7-2 所 示 ， 其 中 使 用 的 参数 如 表 7-3 所 示 。 











Ж72 机 器 模式 定义 宏 举 例 


宏 定 义 
RANDOM МОРЕ (МОРЕ) 
СС МОРЕ (МОРЕ) 


ІЧТ МОРЕ (МОРЕ, ВҮТЕЅІХЕ) 


ЕКАСТІОМАГ ІМТ МОРЕ (МОРЕ, 
PRECISION, ВҮТЕЅІХЕ) 


FLOAT МОРЕ (МОРЕ, BYTESIZE, 
FORMAT) 


DECIMAL ЕГОАТ МОРЕ (MODE, 
BYTESIZE) 


FRACTIONAL FLOAT MODE (MODE, 
PRECISION, BYTESIZE, FORMAT) 


FRACT MODE (MODE, BYTESIZE, FBIT) 


UFRACT МОРЕ (МОРЕ, BYTESIZE, FBIT) 


ACCUM MODE (MODE, BYTESIZE, 
IBIT, FBIT) 


UACCUM MODE (MODE, BYTESIZE, 
IBIT, FBIT) 


RESET FLOAT FORMAT (МОРЕ, FORMAT) 


PARTIAL INT MODE (MODE) 


VECTOR MODE (CLASS, MODE, COUNT) 


VECTOR MODES (CLASS, WIDTH) 


COMPLEX MODES (CLASS) 


义 

声明 MODE 为 一 个 RANDOM 类 型 的 机 器 模式 

声明 MODE 为 一 个 CC 类 型 的 机 器 模式 

声明 MODE 为 一 个 ІМТ 类 型 的 机 器 模式 ， 
节 ， 其 表示 的 所 有 位 都 是 有 意义 的 

声明 МОРЕ 为 一 个 INT 类 型 的 机 器 模式 ， 
17, 但 只 有 PRECISION 个 位 是 有 意义 的 

声明 МОРЕ 为 一 个 FLOAT 类 型 的 机 器 模式 ， 其 宽度 为 BYTESIZE 
个 字 节 ， 并 且 使 用 FORMAT 所 定义 的 浮 点 数 格 式 ， 其 表示 的 所 有 位 都 
是 有 意义 的 

声明 MODE 为 一 个 FLOAT 类 型 的 机 器 模式 ， 
个 字 节 ， 其 表示 的 所 有 位 都 是 有 意义 的 

声明 МОРЕ 为 一 个 FLOAT 类 型 的 机 器 模式 ， 
个 字 节 ， 并 且 使 用 FORMAT 所 定义 的 浮 点 数 格式 ， 
个 位 是 有 意义 的 

声明 MODE 为 一 个 FRACT 类 型 的 机 器 模式 ， 其 宽度 为 BYTESIZE 
个 字 节 ,但 只 有 FBIT 个 小 数位 是 有 意义 的 ， 可 能 会 有 填充 位 

声明 МОРЕ 为 一 个 UFRACT 类 型 的 机 器 模 式 ， 其 宽度 为 BYTESIZE 
个 字 节 , 但 只 有 FBIT 个 小 数位 是 有 意义 的 ， 可 能 会 有 填充 位 

声明 МОРЕ 为 一 个 ACCUM 类 型 的 机 需 模 式 ， 其 宽度 为 BYTESIZE 
个 字 节 ， 其 中 整数 位 为 IBIT， 小 数位 为 FBIT， 可 能 会 有 填充 位 

声明 MODE 为 一 个 UACCUM 类 型 的 机 器 模式 ， 其 宽度 为 
BYTESIZE 个 字 节 ， 其 中 整数 位 为 IBIT， 小 数位 为 FBIT， 可 能 会 有 填 
充 位 

设置 МОРЕ 的 浮 点 数 格式 为 FORMAT 格式 ， 该 MODE 机 器 模式 的 
类 型 必须 是 FLOAT 类 型 

声明 一 个 PARTIAL ІМТ 类 型 的 机 器 模式 ， 该 模式 和 МОРЕ 模式 ( 必 
须 是 ІМТ) 具有 相同 的 存储 大 小 。 该 声明 的 模式 名 称 是 在 МОРЕ 名称 
前 加 上 一 个 “P” 

声明 一 个 向 量 模式 ， 该 向 量 的 元 素 类 型 为 MODE， 元 素数 目 为 
COUNT 个 。CLASS 字段 必须 为 INT 或 者 FLOAT。 该 向 量 模式 的 名 称 
为 VnX， 其 中 Vn X COUNT 的 十 进 制 表示 值 ，X 为 MODE 的 名 称 


( 续 ) 


== 
ЕЗ 
ел 


其 宽度 为 BYTESIZE 个 字 


其 宽度 为 BYTESIZE 个 字 


其 宽度 为 BYTESIZE 


其 宽度 为 BYTESIZE 
其 表示 的 PRECISION 





义 

对 于 模式 类 型 CLASS 中 所 定义 的 每 一 个 机 器 模 式 , 创建 相应 的 向 
量 模式 (having width WIDTH)， 如 果 模 式 mode 的 字 节 宽度 不 能 被 
WIDTH 整除 ， 或 者 创建 的 向 量 只 有 一 个 元 素 ， 或 者 ІМТ 类 型 的 模式 小 
于 1 字 节 ，FLOAT 类 型 的 模式 小 于 2 字 节 ， 则 这 些 模式 将 被 忽略 。 该 
向 量 模式 的 名 称 同 上 

对 于 模式 类 别 CLASS 中 的 每 一 个 机 器 模式 ， 创 建 其 相应 的 复数 类 
型 。 大 小 小 于 1 字 节 的 模式 将 被 忽略 。 对 于 FLOAT 类 型 的 模式 ， 该 复 
数 类 型 的 名 字 可 以 把 FLOAT 类 型 的 模式 名 称 中 的 “F” 和 替换 为 “C ”， 
对 于 INT 类 型 ， 直 接 在 原 有 类 型 的 名 字 前 加 “C” 


ше 
ЖА 


表 7-3 ”机 器 模式 宏 定 义 中 所 使 用 的 参数 


CLASS 


MODE 


PRECISION 
BYTESIZE 


COUNT 


FORMAT 


EXPR 





格式 


机 天 模式 名 称 





机 融 模 式 的 类 型 


可 能 的 取 值 举例 

mode-classes.def 中 定义 ,不 包括 MODE_ 部分， 例如 : 

RANDOM,INT, СС, PARTIAL INT, FRACT, UFRACT, ACCUM, 
UACCUM, FLOAT, DECIMAL FLOAT, COMPLEX INT, COMPLEX 
FLOAT, VECTOR INT, VECTOR FRACT, VECTOR UFRACT, VECTOR 
ACCUM, VECTOR UACCUM, VECTOR FLOAT[ 参见 gcc/mode-classs.def] 

QI、HI、SI、DI 等 

正 整数 常量 ,例如 8 

正 整数 常量 ， 例 如 1 

正 整数 常量 ， 例 如 2 

realh 中 所 定义 的 real 格 式 ， 
format 等 

合法 的 С 表达 式 ， 如 果 该 表达 式 是 逗号 表达 式 ， 
加 0 


例 如 ieee_single format，ieee double 


则 应 在 该 整个 表达 式 外 


下 面 的 例子 是 gcc/machmode.def 文 件 中 的 代码 片段 ， 分 别 举例 说 明 如 下 : 





RANDOM MODE (VOID); 
RANDOM MODE (BLK); 


/* 声明 一 个 机 器 模式 VOIDmode， 其 类 型 为 RANDOM */ 
/* 声明 一 个 机 器 模式 BLKmode， 其 类 型 为 RANDOM */ 


FRACTIONAL INT MODE (BI, 1, 1); 


/* 声明 一 个 INT 闫 型 的 机 器 模式 BImode， 其 宽度 为 1 字 节 ， 


INT MODE (QI, 1); 
INT MODE (HI, 2); 


FLOAT MODE (ГЕ, 


其 中 只 有 1 位 是 有 意义 的 */ 


/* 声明 一 个 INT 类 型 的 机 器 模式 QImode， 其 宽度 为 1 字 节 */ 
J. /* 声明 一 个 INT 类 型 的 机 器 模式 HImode， 其 宽度 为 2 字 节 */ 
FLOAT MODE (SF, 4, ieee single format) 7 
/% 声明 一 个 FLOAT 类 型 的 机 器 模式 SFmode， 宽 度 为 4 字 节 ， 格 式 为 jeee single format */ 


8, ieee double format); 


/* 声明 一 个 FLOAT 类 型 的 机 器 模式 DFmode， 宽 度 为 8 字 节 ， 格 式 为 leee_double format */ 


FRACT MODE (00, 1, 7); / 


* 2847 


*/ 


/* 声明 一 个 FRACT 类 型 的 机 器 模式 QQmode， 宽 度 为 1 字 节 ， 有 7 位 小 数 */ 





下 面 以 INT_MODE (QI，1) 为 例 ， 来 说 明 这 些 机 器 模式 是 如 何 定义 的 。 


在 gcc/genmodes.c 中 有 如 下 宏 定 义 : 





#define ІМТ МОРЕ (N, Y) FRACTIONAL ІМТ MODE (М, -1U, Y) 


#define FRACTIONAL ІМТ МОРЕ (№, В, Y) 


паке int mode (#N, В, Y, _ FILE , _ LINE ) 





通过 宏 定义 1，INT_MODE (QI, 1) 首先 
#N 表 示 把 N 的 内 容 蔡 换 成 其 相应 的 字符 串 。 





函数 make_int_ mode 的 定义 如 下 : 


展开 为 : FRACTIONAL INT MODE (QI、-1U、1) 。 








H 
ін 
4 
ж 
Н 
е 
м 
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展开 为 make _int mode (“QI”、-1U、1、_FILE_、_LINE _) 。 其 中 的 





static void 


make int mode (const char *name, unsigned int precision, unsigned int bytesize, 
const char *file, unsigned int line) 


{ 


struct поде даба *m = пем mode (MODE ІМТ, папе, file, line); 
m->bytesize = bytesize; 
ш->ргесізіоп = precision; 


} 





可 以 看 出 ，make_int mode ( "О", -1U, 1, _ЕПЕ_, ИМЕ) 的 主要 功能 就 是 使 



































new_mode (МОРЕ INT，“QI”、_FILE_、_LINE_) 创建 一 个 mode_data 结 构 ， 返 回 其 指针 ， 并 填 


充 其 字 节 大 小 、 精 度 等 字段 的 值 ， 其 中 _FILE_ 和 _LINE_ 分 别 指 源 代码 文件 的 文件 名 称 及 代码 所 在 的 行 数 。 


gcc/machmode.def 包 含 了 所 有 机 器 可 能 支持 的 机 器 模式 ， 而 config/${target})/${target}-modes.def 中 则 定义 了 与 机 器 相关 的 机 器 模式 ， 以 target=i386 为 例 ， 再 来 看 一 些 与 机 器 相关 的 机 器 模式 。 


在 gcc/config/i386/i386-modes.def 文 件 中 ， 可 以 看 到 如 下 定义 (其 中 行 首 的 编号 为 源 文件 中 的 行 编号 ) : 








24FRACTIONAL FLOAT MODE (XF, 80, 12, ieee extended intel 96 format); 
25FLOAT MODE (TF, 16, ieee quad format); 


/ 省 略 部 分 代码 */ 
61CC МОРЕ (CCGC); 
62CC MODE (CCGOC); 
63CC MODE (CCNO); 
64CC MODE (ССА); 

65CC MODE (ССС); 

/* 省 略 部 分 代码 */ 











这 些 定义 使 























了 与 文件 gcc/machmode.def 中 相同 的 定义 方式 ， 给 出 了 一 些 
文件 ， 产 生 目 标 系统 上 可 以 使 

















标 机 器 上 特定 的 机 器 模式 。gcc/genmode.c 文 件 则 根据 gcc/machmode.def 及 gcc/config/i386/i386-modes.def 这 两 个 


的 所 有 机 器 模式 ， 并 生成 host-i686-pc-linux-gnu/gcc/insn-modes.h 文 件 ， 该 文件 的 部 分 片段 如 下 ， 从 代码 中 的 注释 也 验证 了 上 述说 法 。 





enum machine mode 

{ 
VOIDmode, 
BLKmode, 
CCmode, 
CCGCmode, 
CCGOCmode, 
CCNOmode, 
CCAmode, 
СССподе, 
/ж 省 略 部 分 代码 */ 
BImode, 
QImode, 
/* 省 略 部 分 代码 */ 
XFmode, 
TFmode, 


machmode.def:169 */ 
machmode.def:173 */ 
machmode.def:201 */ 


config/i386/i386-modes. 
config/i386/i386-modes. 
config/i386/i386-modes. 
config/i386/i386-modes. 
config/i386/i386-modes. 


machmode.def:176 */ 
machmode.def:181 */ 


config/i386/i386-modes. 
config/i386/i386-modes. 


def: 
def; 
def: 
def: 


def 


def 
def 


61 
62 
63 
64 
:65 


:24 
:25 


/* 省 略 部 分 代码 */ 
} 





77 ”RTX 的 存储 











RTX 使 用 结构 体 rtx_def 进 行 存储 ， 定 义 在 gcc/rth 中 ， 比 如 : 














struct rtx def 
1 
ENUM BITFIELD(rtx code) code: 16; 
ENUM BITFIELD (machine mode) mode : 8; 
unsigned int jump : 1; 
unsigned int call : 1; 
unsigned int unchanging : 1; 
unsigned int volatil 
unsigned int іп struct 
unsigned int used : 1; 
unsigned frame_related : 1; 
unsigned return val : 1; 
union u { T 
rtunion fld[1]; 
HOST_WIDE_INT hwint[1]; 
struct block_symbol block sym; 
struct real Value rv; Е 
struct fixed value fv; 
рш 


1; 





该 结构 体 分 为 以 下 两 大 部 分 : 


(1) RTX 首部 (RTX Header) ， 其 中 描述 了 RTX 的 RTX_CODE、 机 器 模式 ， 以 及 一 些 RTX 标 志 。 所 有 RTX 首部 的 长 度 都 是 相同 的 ， 可 以 使 用 RTX_HDR_SIZE 宏 定义 来 获得 ， 该 定义 比如 : 





#define RTX НОК SIZE offsetof (struct гіх def, u) 





首部 的 长 度 等 于 struct rtx_def 中 字段 u 在 该 结构 体内 的 偏 移 量 (以 字 节 计算 ) 。 





(2) RTX 的 第 0 操作 数 。RTX 的 操作 数 使 用 union u 进 行 存储 ， 该 联合 体 可 以 表示 一 个 rtunion 联 合体 表示 的 某 一 种 操作 数 、 一 个 HOST_WIDE_INT 宽 度 的 整数 、 一 个 block_symbol 结 构 体 、 一 个 实数 或 
者 定点 数 等 。 








IR] 





到 7-2 给 出 了 struct rtx_def 结 构 体 的 示意 

















ЕМОМ <ВІТПІЕІ Ә(гіх сойе) сойе: 16; 


union rtunion def 


int rt_int; 


ENUM_BITFIELD(machine_mode) mode 8; unsigned int rt_uint; 


'unsigned int jump: 1; 
'unsigned int call: 1; 
'unsigned int unchanging: 1; 
'unsigned int volatil: 1; 
unsigned int in struct: 1: 
unsigned int used: 1; 
unsigned бате - related : 15 


HOST _ WIDE INT hwint[1]; 
struct block_symbol block sym; 
struct real value гу; 

struct fixed_value fv; 























const char*rt str; 

гіх rt гіх; 

гіуес гі гіуес; 

enum тасһіпе mode гі type; 

addr diff vec flags rt addr diff vec flags; 

struct cselib val struct *rt cselib; 

struct bitmap head def *rt_ bit; 

tree гі tree; 

struct basic block def *rt_ bb; 

тет attrs “ті теп; 

гер айт “ті гер; 

struct constant descriptor гіх *rt constant; 
}; 


typedef union rtunion def rtunlon; 





struct block symbol GTY (О) { 
rtunion GTY((skip)) fld[3]; 
struct object block *block; 
HOST WIDE INT offset; 


}; 


struct real value GTY (©) 
( 

unsigned int сі: 2; 
unsigned int decimal: 1; 
unsigned int sign: 1; 
unsigned int signalling: 1: 
unsigned int canonical: 1; 
unsigned int uexp: EXP BITS; 


unsigned long sig[SIGSZ]; 
gcc/real.h 


struct ћхеа value GTY 





double int data; 


igned int mode; 
}; азан gcc/fixed-value.h 


7-2 RTX 存储 结构 


由 于 各 种 RTX 表达 式 包 含 的 操作 数 数目 和 类 型 不 尽 相 同 ， 所 以 每 种 RTX 的 实际 存储 大 小 也 不 尽 相 同 。 对 于 RTX_CODE 为 CODE 的 RTX 来 说 ， 可 以 通过 RTX_CODE_ SIZE (CODE) 来 获得 存储 该 RTX 的 实际 

















大 小 ， 其 定义 如 下 : 








#define ЕТХ CODE SIZE (CODE) rtx code size[CODE] 





const unsigned char rtx_code_size[] 数 组 的 初始 化 在 gcc/rtl.c 中 完成 ， 如 下 所 示 : 





/* Indexed by rtx code, gives the size of the rtx in bytes. */ 
сопзі unsigned char гіх code size[NUM RTX CODE] = { 
#define DEF RTL FXPR(ENUM, МАМЕ, FORMAT, CLASS) 
((ENUM) -- CONST; INT || (ENUM) == CONST_DOUBLE || (ENUM) == CONST_FIXED 
RTX НОК _ SIZE + (sizeof FORMAT - 1) * sizeof (HOST_WIDE_INT) е 
: ВТХ НОК SIZE + (sizeof FORMAT - 1) * sizeof (rtunion)), 
#include "rtI.def" 
#undef DEF RTL EXPR 
1; 


\ 
\ 
\ 








也 就 是 说 ， 对 于 RTX_CODE 为 CONST_ INT、CONST_DOUBLE 或 者 CONST_FIXED 的 RTX 来 说 ， 其 存储 所 需要 的 空间 为 : 





RTX НОК SIZE + (sizeof FORMAT - 1) * sizeof (HOST WIDE ІМТ) 








对 于 其 他 的 RTX， 其 存储 空间 的 大 小 为 : 





RTX HDR SIZE + (sizeof FORMAT - 1) % sizeof (rtunion)) 








以 DEF_RTL EXPR (INSN, "insn", "iuuBieie", RTX_INSN) 为 例 ， 其 RTX_CODE 为 INSN，FORMAT 为 "iuuBieie "， 





因此 rtx_code _size[INSN] 的 大 小 为 : 





АТХ НОК SIZE + (sizeof "iuuBieie" - 1) * sizeof (rtunion)) 








其 中 ，sizeof"iuuBieie" 的 值 为 9， 
上 存储 所 有 操作 数 的 存储 空间 ， 即 : 


(sizeof"iuuBieie"-1) 为 8， 即 操作 数 的 个 数 ， 每 个 操作 数 均 使 用 union rtunion 存 储 ， 其 大 小 为 sizeof (rtunion) , 








因此 ， 该 RTX 的 实际 存储 大 小 为 RTX 首部 大 小 加 





RTX HDR SIZE + 8 * sizeof (rtunion) 








Ий] 








7-3 给 出 了 该 RTX (RTX_CODE=INSN) 的 存储 结构 : 





rtx header 
орегапа 0 


RTX HDR SIZE| 


operand 1 
operand 2 
operand 3 
operand 4 
operand 5 
operand 6 
operand 7 


(sizeof "iuuBieie" 
—]) * sizeo 
(rtunion) 


л л | 





7-3 INSN 存 储 结 构 











再 来 看 一 个 例子 ， 对 于 如 下 的 RTX: 


struct rtx_def 


union rtunion def 
union rtunion def 
union rtunion def 
union rtunion def 


INSN 
存储 空间 


union rtunion def 
union rtunion def 
union rtunion def 





DEF КТІ, EXPR(CONST ІМТ, "const іпі", "и", RTX CONST OBJ) 








其 RTX CODE 为 CONST_ INT，FORMAT 为 "w"， 因 





此 rtx_code size[CONST_INT] 的 大 小 为 : 





RTX НОК SIZE + (sizeof FORMAT - 1) % sizeof (HOST WIDE ІМТ) 








其 中 ，sizeof"w" 的 值 为 2， (sizeof"w"-1) 为 1， 即 操作 数 的 个 数 。 每 个 操作 数 的 大 小 为 sizeof (HOST_WIDE ІМТ) , 
RTX_HDR_SIZE， 再 加 上 存储 一 个 HOST_ WIDE_INT 所 需 的 存储 空间 。 


7.8 ”RTX 表达 式 


GCC 中 定义 的 RTX 及 其 RTX_CODE 等 信息 在 rtl.def 文 件 中 声明 ， 可 以 通过 下 述 命令 查看 : 





因 








此 ， 存 储 RTX 代 码 为 CONST_INT 结 构 体 的 实际 大 小 为 RTX 的 首部 大 小 








[6СС@1оса1ћоѕі paag-gcc]$ grep ^DEF ЕТІ, EXPR gcc/rtl.def 


тән 


ПЕК КТІ EXPR (UNKNOWN, "UnKnown", 
DEF RTL EXPR (EXPR 115Т, "expr lis 
DEF RTL EXPR(INSN LIST, "insn lis че", RTX EXTRA) 
DEF RTL EXPR (SEQUENCE, "sequence", "E", RTX EXTRA) 

DEF RTL EXPR (ADDRESS, "address", "e", RTX MATCH) 
( 
( 
( 


", ЕТХ ЕХТВА) 
ее", RIX ЕХТВА) 






DEF RTL EXPR(INSN, "insn", "iuuBieie", АТХ INSN) 
DEF RTL EXPR(JUMP INSN, "jump insn", "iuuBieie0", RTX INSN) 
DEF RTL EXPR (CALL INSN, "call insn", "iuuBieiee", RTX INSN) 
/* Жа з В т т 
DEF RTL EXPR (АТТА ҒАС, "attr flag", "s", RTX EXTRA) 
ПЕК RTL FXPR(COND, "сопа", "Ее", АТХ EXTRA) 


%/ 














在 上 述 RTX 定 义 中 , Ж 











了 如 下 的 定义 格式 : 





DEF КТІ. EXPR (RTX_CODE， RTX МАМЕ, PRINT FORMAT, КТХ СТА55) 





























其 中 ，RTX_CODE 就 是 RTX 的 代码 ，RTX_NAME 是 该 RTX 的 外 部 名 称 ， 可 以 使 用 read_rtx () 读 取 或 者 使 
PRINT_RORMAT 是 RTX 中 操作 数 的 输出 形式 ， 每 种 RTX 的 格式 定义 在 rtx_format[ 数 组 中 (参见 文件 gcc/rtl.c 

















上 述 声 明 的 RTX 中 ， 根 据 RTX 的 类 别 ， 可 以 使 用 








print_rtx () 进行 显示 ， 这 些 RTX 名 称 保存 在 rtx_name[ 数 组 中 (参见 文件 gcc/rtlc) ; 
; RTX_CLASS 描 述 了 该 RTX 的 类 型 。 关 于 RTX 类 型 及 其 输出 格式 详 见 7.4 节 。 





下 述 的 shell 命 令 ， 输 出 GCC 4.4.0 中 所 有 RTX 的 分 类 ， 及 每 种 类 型 中 所 包含 的 RTX 数量 。 





[GCC@1localhost раад-асс15 grep ^ 
6 RTX AUTOINC + 
19 RTX BIN ARITH 
2 RTX BITFIELD OPS 
13 RTX СОММ ARITH 
6 RTX COMM СОМРАВЕ 
12 RTX СОМРАВЕ 
8 RTX CONST OBJ 
62 RTX EXTRA 
3 RTX INSN 


类 型 为 RTX_AUTOINC 的 RTX 数 量 有 6 种 */ 


DEF ЕТІ. gcc/rtl.def | sed s/\(/\ /9 | sed s/\)// g | sed в/,// g | awk '{ргіпі $5}' | sort | uniq -c 


10 RTX MATCH 
10 RTX OBJ 

2 АТХ TERNARY 
29 RTX_UNRRY 














当然 ， 也 可 以 使 用 下 述 的 shell 脚 本 显示 每 种 类 型 所 包含 的 RTX， 读 者 可 以 自行 实验 。 























#!/bin/bash 
CLASS=“ grep “ГЕР ЕТІ, gcc/rtl.def | sed s/\(/\ /9 | sed s/\)// g | sed в/,// g | awk '{print $5}' | sort | џпі` 

for с іп $CLASS 

do 

есһо -п "[RTX CLASS: $с]: " 

grep “DEF КТІ gcc/rtl.def | sed s/\(/\ /9 | sed s/\)// g | зей 5/,// g | grep $c | awk '{printf $2 " "} END{print ""}' 
done 








执行 的 结果 如 表 7-4 所 示 。 另 外 ， 前 面 提 到 过 ，RTL 包 括 IR-RTL 和 MD-RTL， 分 别 为 源 代码 的 中 间 表 示 和 机 器 描述 。 对 于 RTX 表 达 式 来 说 ， 有 些 RTX 只 能 出 现在 IR-RTL 中 ， 有 些 只 能 用 于 MD-RTL， 有 些 
在 两 者 中 均 可 出 现 。 表 7-4 也 给 出 了 RTX 在 IR-RTL 和 MD-RTL 中 的 使 用 情况 。 





表 7-4 RTX 分 类 及 其 使 用 概况 


RTX 分 类 数 
RTX_CODE 上 
(RTX_CLASS) Н шы 


РКЕ БЕС РО5Т ПЕС PRE MODIFY 1 
RTX AUTOINC 自 加 自 减 运算 
PRE INC POST_INC POST MODIFY 














ASHIFTRT UMOD 19| ХНА (不 
LSHIFTRT ASHIFT 可 交换 ) 
ROTATERT ROTATE 
RTX BIN ARITH |55. ҮЕС SELECT SS_MINUS 
VEC_CONCAT SS_ASHIFT 
US_ASHIFT 
US_MINUS 
RTX BITFIELD |SIGN EXTRACT |ZERO EXTRACT 位 操作 
OPS 
PLUS UMIN 交换 运算 
тыс MULT UMAX 
мим =| SS MULT SS_PLUS 
US_MULT US_PLUS 
RTX COMM UNORDERED UNEQ 比较 
COMPARE ORDERED LTGT 
UNGE 12 = 
RTX COMPARE GT GTU 可 交换 ) 
CONST INT СОМЅТ УЕСТОК SYMBOL КЕЕ 常量 
RTX CONST OBJ | CONST_FIXED CONST HIGH 





CONST DOUBLE |LABEL REF 


7.9 


insn, 











RTX 分 类 数 
UNKNOWN DEFINE SPLIT BARRIER, 
EXPR LIST DEFINE INSN AND SPLIT RETURN CODE LABEL, 
INSN LIST TRAP IF EXCLUSION SET NOTE 只 能 出 现 
SEQUENCE RESX PRESENCE SET 在 IR-RTL 中 
SUBREG FINAL PRESENCE SET 
STRICT LOW PART ABSENCE SET DEFINE * 只 
VAR LOCATION FINAL ABSENCE SET 能 用 于 MD RTL 
INCLUDE DEFINE BYPASS 中 ， 用 来 进行 机 
DEFINE PEEPHOLE2 DEFINE AUTOMATON ARTA 
й DEFINE EXPAND AUTOMATA OPTION 
RTX EXTRA ASM OPERANDS | DEFINE DELAY DEFINE RESERVATION 
UNSPEC DEFINE ASM ATTRIBUTES DEFINE ATTR 
UNSPEC VOLATILE | DEFINE COND EXEC ATTR 
ADDR VEC DEFINE PREDICATE SET АТТЕ 
ADDR DIFF VEC | DEFINE SPECIAL PREDICATE | SET ATTR ALTERNATIVE 
PREFETCH DEFINE REGISTER. CONSTRAINT | ЕО ATTR 
SET DEFINE CONSTRAINT EQ ATTR AIT 
USE DEFINE MEMORY CONSTRAINT | ATTR FLAG 
CLOBBER DEFINE ADDRESS CONSTRAINT | COND 
DEFINE INSN DEFINE INSN RESERVATION | DEFINE CPU UNIT 
DEFINE PEEPHOLE | DEFINE QUERY СРО UNIT 
RIXINSN кат 
ADDRESS MATCH PARALLEL МАТСН PAR DUP MD RTL, я 
МАТСН OPERAND | МАТСН DUP МАТСН CODE ВЕЛЭ РЕЛ: 
ЕТХ МАТСН 
一 MATCH SCRATCH | МАТСН OP_DUP МАТСН TEST 中 的 匹配 描述 
MATCH OPERATOR 
CONST STRING |SCRATCH 
RTX OBI PC CONCAT 


VALUE 


CONCATN 





LO_SUM j 


前 面 提 到 过 ， 和 AsT、GIMPLE 相 同 ，RTL 也 是 GCC 的 一 种 中 间 表 示 形 式 。RTL 可 以 用 来 进行 机 器 描述 ， 


RTX TERNARY |ІЕ ТНЕМ№ ЕГЅЕ VEC MERGE =Z 三 目 运 算 
目 


UNSIGNED FIX 


NOT FRACT CONVERT 
SIGN EXTEND UNSIGNED FRACT CONVERT 
ZERO EXTEND |ЅАТ FRACT 
еле TRUNCATE UNSIGNED SAT FRACT 

= FLOAT EXTEND |АВ5 
FLOAT TRUNCATE | SQRT 
FLOAT BSWAP 
FIX FFS 
UNSIGNED FLOAT | CLZ 

IR-RTL 





























来 表示 程序 中 的 算术 运算 、 程 序 跳 转 、 标 号 等 ， 也 可 以 








来 表示 各 种 说 明 信 息 。insn 包 括 了 如 下 6 种 RTX 类 型 : 








POPCOUNT 
PARITY 

VEC DUPLICATE 
55 NEG 


08 МЕС 
55 АВ5 

$5 ТЕОМСАТЕ 
US_TRUNCATE 





也 可 以 描述 由 GIMPLE 形 式 转换 而 来 的 程序 代码 信息 。GCC 中 描述 程序 代码 信息 的 RTL 被 称 为 





DEF КТІ, EXPR 
DEF RTL EXPR 
DEF RTL EXPR 
DEF RTL EXPR 
DEF RTL EXPR 
DEF RTL EXPR 


INSN, "insn", "iuuBieie", RTX INSN) 
JUMP_INSN, "jump insn", "ішіВіеіей", RTX INSN) 

CALL INSN, "call insn", "iuuBieiee", RTX INSN) 

BARRIER, "barrier", "iuu00000", RTX EXTRA) 

CODE LABEL, "code label", "ішіВ0015", RTX EXTRA) 
NOTE, "note", "iuuBOni", RTX EXTRA) 








其 主要 描述 及 意义 如 表 7-7 所 示 。 





表 7-7 insn 一 览 表 


RTX CODE |RTX NAME| 1 | втҳ cLASS 表示 意义 
= ЕОВМАТ 一 = 


INSN 表示 无 跳 转 的 非 函 数 调用 的 指令 
表示 可 能 引起 跳 转 的 指令 ， 或 者 当 指 令 中 包含 标签 引 
用 (label ref) 表达 式 ， 并 且 该 指令 可 以 将 pc 值 设 置 为 


п 也 22 АРІ N An WHEA - 5 
ЛОМР INSN ump insn |ішіВіеіе0 | ЕТХ INSN 、 
jump_ 该 标签 引用 的 值 。 另 外 ， 从 当前 函数 返回 的 指令 也 会 标 
ш jump_insn 


CALL INSN RTX INSN 示 函 数 调 用 的 指令 


ТТ 和 § 令 流 无 法 达到 的 位 置 。 例 如 ，barrier 可 以 被 放 


2. 会 返回 到 调用 孔 数 的 volatile 函数 (例如 


BARRIER barrier iuu00000 |RTX EXTRA ИЯ EE EA RTE ART, ә - 
exit РА) 的 函数 调用 之 后 


CODE_LABEL | code label |iuuB00is |RTX_EXTRA | 表示 一 个 jump_insn 可 以 跳 转 到 的 标签 


NOTE RTX EXTRA | 表示 调试 信息 或 者 其 他 标记 信息 


通过 上 述 表 格 可 以 看 出 ， 这 6 种 insn 包 括 的 操作 数 数 目 不 尽 相同 ， 所 有 insn 的 前 3 个 操作 分 别 是 insn 的 UID 值 、insn 的 前 驱 节点 指针 以 及 insn 的 后 继 节点 指针 ， 分 别 使 用 INSN_UID (insn) 、 


РКЕМ ІМ5М (insn) 及 NEXT_INSN (insn) 进行 访问 ， 对 于 insn 中 各 个 字段 的 访问 可 以 使 用 如 下 的 宏 定 义 : 








/% 访问 insn 中 各 个 字段 的 宏 定 义 */ 

/* 获取 insn 的 UID */ 

#define INSN UID(INSN) XINT (INSN, 0) 

/* 获取 insn 链 表 中 当前 insn 的 上 一 条 insn、 下 一 条 insn、 当 前 insn 所 在 的 基本 块 以 及 当前 insn 在 源 代码 中 的 位 置 等 信息 */ 
#define PREV_INSN (INSN) ХЕХР (INSN, 1) 

#define NEXT INSN (INSN) ХЕХР (INSN, 2) 

#define BLOCK_FOR_INSN (INSN) XBBDEF (INSN, 3) 

#define INSN LOCATOR(INSN) XINT (INSN, 4) 

/* 获取 insn 的 主体 */ 

#define PATTERN (INSN) ХЕХР (INSN, 

/*  Жіпвп code, Bp ТЕТІГІ 令 模板 编号 */ 
#define INSN |_ CODE (INSN) XINT (INSN, 6) 





所 有 的 insn 被 一 个 双向 链表 所 连接 (注意 ， 不 是 循环 双向 链表 ) 。 


在 一 个 函数 中 ， en ( 即 前 驱 、 后 续 节点 指针 ) 彼此 连接 成 为 一 个 双向 链表 ， 如 图 7-4 所 示 。 O 即 可 获 和 каш ААА — “іп дА, ІІМ 








当前 函数 中 的 INSN_ PREV (insn) : 获取 下 一 条 insn 
第 一 条 insn INSN NEXT (insn) : 获取 前 一 条 insn 





图 7-4 INSN 双 向 链表 示意 











下 面 分 别 对 上 述 6 种 INSN 进 行 介绍 。 


710 ”小结 


本 章 主要 介绍 了 RTL 中 间 表 示 形 式 的 基本 概念 、RTX 表 达 式 的 表示 方法 及 存储 结构 ， 并 通过 一 些 实例 ， 对 常见 的 RTX 进行 了 详细 的 描述 。 


第 8 章 ”机 器 描述 文件 ${target}.md 


get last insns () 


一 insn 


当前 函数 中 的 
最 后 一 条 insn 





GCC 编译 器 支持 多 种 前 端 程序 设计 语言 ， 同 时 也 支持 多 种 后 端的 目标 机 器 ， 即 可 以 为 多 种 不 同 的 目标 机 器 生成 代码 ， 这 种 跨 平台 的 特性 就 在 于 GCC 中 引入 了 RTL 中 间 表 示 形 式 。RTL 既 可 以 作为 GCC 的 
中 间 表 示 (1А) ， 用 来 表示 程序 代码 的 内 容 ， 同 时 也 可 以 作为 一 种 规范 化 的 语言 ， 用 来 描述 目标 机 器 。 通 过 使 用 RTL 语 言 对 不 同 的 目标 机 器 进行 规范 化 描述 ， 将 目标 机 器 的 特性 提取 出 来 ， 用 来 将 语言 无 关 | 
与 目标 机 器 无 关 的 GIMPLE 中 间 表 示 形 式 映射 到 与 机 器 特性 相关 的 RTL 语 言 ， 从 而 进一步 生成 目标 机 器 相关 的 代码 。 






















































































机 器 描述 主要 包括 以 下 两 个 部 分 : 








(1) 机 器 描述 (Machine Description, MD) 文件 ， 即 $ftarget}.md 文 件 ， 其 中 $ftarget} 为 目标 系统 名 称 ， 主 要 描述 了 目标 机 器 所 支持 的 每 条 指令 的 指令 模板 (Instruction Pattern， 即 Insn 


Pattern) ; 

















(2) 机 器 描述 的 头 文件 及 c 文 件 ， 即 $ftarget}.[ch] 文 件 ， 主 要 描述 了 与 机 器 相关 的 变量 声明 与 函数 实现 ， 同 时 用 来 配合 md 文件 ， 实 现 其 指令 模板 里 变量 的 定义 及 其 函数 代码 的 实现 等 。 











另外 ， 从 代码 生成 的 角度 看 ， 整 个 GCC 编译 器 的 编译 过 程 主要 包括 : 





(1) 编译 器 前 端 (Front Епа) 读 取 源 文 件 ， 并 建立 抽象 语法 树 ， 即 完成 高 级 语言 源 代码 到 AST/GENERIC 的 转换 ; 





(2) 将 与 语言 相关 的 AST/GENERIC 转 换 成 与 语言 无 关 的 GIMPLE 中 间 表 示 ， 并 在 此 基础 上 完成 各 种 与 目标 机 器 无 关 的 优化 ; 





(3) 通过 机 器 描述 文件 ， 提 取 各 种 具有 标准 指令 模板 名 称 的 指令 模板 ， 并 以 这 些 指令 模板 为 依据 ， 将 GIMPLE 中 间 表 示 转 换 成 RTL 语 言 表示 的 insn 序 列 ， 即 完成 RTL 的 构造 ， 随 后 在 此 基础 上 ， 完 成 各 种 
与 目标 机 器 相关 的 优化 ; 





(4) 对 于 insn 序 列 中 的 每 一 个 insn， 分 别 和 机 器 描述 文件 中 的 指令 模板 进行 匹配 ， 如 果 匹 配 成 功 ， 则 提取 该 指令 模板 中 的 指令 输出 模板 ， 并 以 此 生成 汇编 代码 。 























在 (3) 和 (4) 两 个 阶段 ， 即 生成 insn 序 列 以 及 从 insn 序 列 生成 汇编 代码 的 过 程 中 ， 都 需要 获取 机 器 描述 中 的 相关 信息 ， 从 而 指导 insn 构 造 和 汇编 代码 的 生成 (insn 匹 配 ) 。 因 此 ， 正 是 因为 采用 了 机 
器 描述 ， 才 将 目标 机 器 的 特性 引入 编译 器 中 ， 从 而 指导 编译 器 根据 目标 机 器 的 特性 进行 insn 的 生成 和 优化 ， 并 最 终 完 成 目标 代码 的 生成 。 


















































本 章 将 主要 介绍 如 何 使 用 RTL 语 言 进行 目标 机 器 的 描述 ， 即 $ftargetj.md 文 件 的 基本 内 容 。 第 9 章 介绍 对 应 的 ${targetj[ch] 文 件 。 





























8.1 机 器 描述 文件 
































机 器 描述 就 是 使 用 规范 的 RTL 语 言 对 目标 机 器 的 特性 进行 描述 。 由 于 目标 机 器 的 特性 干 差 万 别 ， 尤 其 是 各 种 机 器 的 指令 系统 各 不 相同 ， 为 了 方便 GCC 提取 目标 机 器 的 各 种 特性 ， 必 须 使 用 规范 的 描述 语 
言 RTL (这 里 是 MD-RTL) 进行 机 器 描述 。 












































使 用 RTL 书 写 的 机 器 描述 文件 ， 尤 其 是 其 中 指令 模板 的 定义 ， 指 导 了 GIMPLE 中 间 表 示 形 式 向 RTL 中 间 表 示 形 式 转换 的 具体 形式 ， 这 就 使 得 机 器 无 关 的 GIMPLE 形 式 转 换 成 RTL 后 ， 能 够 表达 目标 机 器 的 特 
点 ， 从 而 完成 从 机 器 无 关 的 GIMPLE 表 示 到 机 器 相关 的 RTL 表 示 的 转换 。 从 这 个 角度 上 讲 ， 基 于 RTL 语 言 的 机 器 描述 是 GCC 支 持 多 目标 机 器 的 基础 。 






































GCC 为 每 种 所 支持 的 目标 机 器 均 提 供 了 机 器 描述 ，gcc/config/${target} 目 录 中 就 包含 了 GCC 关 于 目标 机 器 $ftarget} 的 机 器 描述 文件 $ftarget}.md。 例 如 ， 针 对 Intel 的 i386 处 理 器 架构 所 提供 的 机 器 描 
述 文件 为 gcc/config/i386/i386.md， 针 对 MIPS 处 理 器 的 机 器 描述 文件 为 gcc/config/mips/mips.md， 等 等 。 






































机 器 描述 文件 主要 包含 了 表 8-1 中 的 内 容 ， 主 要 包括 各 种 指令 模板 (lnsn Pattern) 的 定义 、 常 量 (Constant) 定义 、 属 性 (Attribute) 定义 、 自 定义 断言 (User-Defined Predicate) 、 自 定义 约束 
(User-Defined Constraint) 、 枚 举 器 (Iterator) 定义 、 流 水 线 (Pipeline) 声明 、 帘 孔 优 化 (Реерһоіе Optimization) 定义 等 。 





























读者 在 分 析 机 器 描述 文件 时 ， 需 要 对 目标 机 器 的 特性 具有 一 定 的 了 解 ， 尤 其 是 目标 机 器 的 指令 系统 和 硬件 架构 ， 同 时 可 以 参考 一 些 现 有 的 机 器 描述 文件 的 源 代码 ， 并 结合 gdb 等 调试 工具 对 机 器 描述 文 
件 中 所 含 内 容 进行 跟踪 调试 和 分 析 ， 从 而 了 解 机 器 描述 文件 的 细节 及 其 作用 。 























表 8-1 机 器 描述 文件 的 主要 内 容 





机 器 描述 内 容 ж X 主要 使 用 的 RTX 
елу ОИТ РЕЯ define іпѕп define ехрапа 
BORGEN | 定义 指令 模板 че” ы ы : 
define_split define_insn_and_split 
常量 定义 定义 机 响 描 述 文件 中 所 使 用 的 常量 define_constants 


属性 定义 define attr define mode attr 

约束 定义 define_ сопѕігаіпі define register constraint 
包括 机 器 模式 枚 举 器 和 RTX_CODE МОй, 

枚 举 器 定义 适用 于 书写 一 类 指令 模板 形式 相同 ， 但 具有 不 | define code iterator Яеѓіпе mode iterator 

同 机 器 模式 或 者 RTX_CODE 的 指令 模板 





define іпѕп гезегуайоп define reservation 





流水 线 定义 | 定义 流水 线 | | 
define_cpu_unit define_automaton 
ILEX | Е ЯЯ, (peephole) 优化 策略 define_peephole define_peephole2 


本 章 将 针对 机 器 描述 文件 中 的 上 述 内 容 ， 分 别 进行 讨论 。 





82 ”指令 模板 











MD 文件 包含 了 目标 机 器 所 支持 的 每 一 条 指令 的 指令 模板 ， 其 形式 如 下 : 








(define іпзп 指令 模板 名 称 
АТЫ 
ж 


条 件 
输出 模板 
属性 

) 








指令 模板 定义 中 主要 由 指令 模板 名 称 、RTL 模 板 、 条 件 、 输 出 模板 及 属性 部 分 组 成 。 其 中 ， 指 令 模板 的 名 称 (Pattern Мате) 由 字符 串 给 出 ， 唯 一 地 描述 了 该 指令 模板 。RTL 模 板 (RTL Template) 提 
供 了 一 个 不 完整 的 RTX 向 量 ， 用 来 描述 指令 的 RTX 表示 形式 ， 如 果 该 RTX 向 量 只 有 一 个 元 素 ， 则 表示 普通 的 指令 模板 ， 也 可 以 有 多 个 元 素 ， 表 示 并 行 的 (Parallel) 指令 模板 。 条 件 (Condition) 部 分 是 一 个 
5 语言 的 表达 式 ， 是 用 来 判断 某 个 insn 是 否 与 该 指令 模板 匹配 的 最 后 条 件 。 输 出 模板 (Output Template) 部 分 描述 了 该 指令 模板 转换 成 目标 汇编 代码 时 的 输出 格式 。 最 后 一 部 分 是 属性 (Attribute) 部 
分 ， 用 来 设置 该 指令 的 一 些 属性 值 ， 该 部 分 通常 可 以 省 略 。 


























































































































司 8-1 给 出 了 MIPS 机 器 中 一 条 指令 模板 的 具体 实例 ( 见 gcc/config/mips/mips.md) 。 该 指令 模板 由 define insn 描 述 ， 其 名 称 为 “*addsi3_ extended”; RTL 模 板 部 分 为 一 个 不 完整 的 RTX 表达 式 ， 其 
中 的 部 分 操作 数 使 用 match_operand 表 达 式 描述 ， 用 来 描述 该 操作 数 的 一 些 匹配 条 件 ; 条 件 部 分 则 使 用 一 个 C 语 言 的 表达 式 ， 该 表达 式 用 来 描述 insn 与 该 指令 模板 是 否 匹 配 的 最 后 一 个 条 件 ， 如 果 返 回 为 
true， 则 给 定 的 insn 与 该 指令 模板 匹配 ， 否 则 为 不 匹配 ; 指令 输出 模板 部 分 则 给 出 了 不 同情 况 下 ， 该 指令 模板 对 应 的 汇编 代码 的 输出 格式 ; 最 后 的 属性 设置 部 分 则 设置 了 属性 “type” 的 值 为 “arith”， 设 
置 属性 “mode” 的 值 为 “SI”。 




























































































(define insn|"*addsi3 extended" 模板 名 称 


[(set (match operand:DI 0 "register operand" "=d,d") 


(sign extend:DI | түн RTL 模 板 
(Plus:SI (match operand:SI 1 "register operand" "d,d") 
(match operand:SI 2 "arith орегапа" "d,Q"))))] 


"TARGET 64BIT && !ТАКСЕТ MIPS16" 


addu\t%0,%1,%2 
addiu\t%0,%1,%2" 


[(set_attr "type" "arith") 
(set_attr "mode" "SI")] 





Instruction Райегп-- gcc/config/mips/mips.md 


图 8-1 机 器 描述 文件 中 的 指令 模板 


8.2.1~8.2.5 节 分 别 对 指令 模板 中 的 五 个 部 分 ， 包 括 指令 模板 名 称 、RTL 模 板 、 条 件 、 输 出 模板 、 属 性 进行 详细 的 论述 。 





83 定义 RTL 序 列 


























在 某 些 特定 的 机 器 上 ， 一 个 具有 标准 模板 名 称 的 指令 模板 所 生成 的 指令 不 能 被 一 条 insn 所 表示 ， 但 是 可 以 用 一 系列 的 insn 表 示 ， 此 时 就 可 以 利用 define_expand 来 描述 如 何 生成 这 一 系列 的 insn。 与 
define_insn 所 不 同 的 是 ，define_ expand 只 在 RTL 构 造 时 使 用 。 




















define_expand 使 用 了 4 个 操作 数 : 














(1) 名 称 : 每 个 define_expand 必 须 有 了 唯一 的 名 称 。 



































(2) RTL 模 板 : RTL 表 达 式 的 向 量 ， 用 来 表示 一 系列 单独 的 指令 ， 与 define_insn 所 不 同 的 是 ， 该 模板 中 不 包括 隐 式 的 并 行 含 义 。define_expand 中 的 RTL 模 板 只 在 RTL 构 造 时 使 用 ， 而 不 参与 代码 生成 时 
的 匹配 过 程 。 






































(3) RF: C 表 达 式 的 字符 串 ， 该 表达 式 根据 GCC 运 行 时 命令 行 所 选择 的 目标 机 器 的 子 类 型 (sub-classes) 来 描述 该 模板 的 可 用 性 (Availability) 。 这 一 点 与 具有 标准 模板 名 称 的 define_insn 中 的 条 
件 部 分 很 类 似 。 因 此 ， 如 果 该 条 件 存在 ， 那 么 该 条 件 不 应 该 依赖 于 需要 匹配 的 insn 中 的 数据 ， 而 只 应 该 与 目标 机 器 类 型 标志 (Target-Machine-Type Flag) 有 关 。 
























































(4) 准备 语句 : 包含 0 个 或 者 多 个 C 语 句 的 字符 串 ， 这 些 C 语 句 在 从 RTL 模 板 生成 RTL 代 码 之 前 执行 。 通 常 这 些 语 句 会 给 RTL 生 成 准备 一 些 临 时 的 寄存 器 ， 作 为 RTL 模 板 中 的 内 部 操作 数 使 用 ， 当 然 ， 这 些 
语句 也 可 以 通过 调用 一 些 例 程 (如 emit_insn 函 数 ) 等 直接 生成 insn， 这 些 insn 将 插入 在 由 RTL 模 板 生成 的 insn 之 前 。 



























































司 8-3 给 出 了 一 个 define_expand 的 实例 。 








使 


(define expandl"addsi3" 名 称 
[(match operand:SI 0 "register operand" "") 


(match operand:SI 1 "register operand" "") 


(match operand:SI 2 "register operand" "")] 





gei 







handle ада (operands[0], operands[1], operands[2]) ; 
: 准备 语句 
准备 语句 


ү 


图 8-3 define_expand 实 例 


需要 注意 的 是 ， 由 define_expand 所 产生 的 每 一 个 insn 都 应 该 与 机 器 描述 文件 中 define_insn 所 描述 的 某 些 模板 所 匹配 ， 否 则 ， 编 译 器 在 生成 代码 或 者 优化 时 可 能 崩溃 (crash) 。 














define_expand 中 的 RTL 模 板 不 仅 控制 insn 的 生成 ， 同 时 也 描述 了 使 用 该 模板 时 每 个 操作 数 需要 满足 的 条 件 ， 该 条 件 由 操作 数 的 断言 部 分 给 出 。RTL 模 板 中 实际 参与 insn 生 成 的 操作 数 在 首次 出 现时 应 该 



































match_operand， 如 果 该 操作 数 在 RTL 模 板 中 使 用 多 次 ， 应 该 使 用 match_dup。 







































































在 准备 语句 中 有 两 个 特殊 的 宏 定 义 : DONE 和 FAIL， 使 用 时 如 上 分 号 ， 就 像 一 条 语句 一 样 使 用 。DONE 用 来 表示 该 模板 RTL 生 成 的 结束 ， 此 时 只 有 准备 语句 中 那些 显 式 调用 emit insn 所 产生 的 insn 作 为 








该 模板 的 RTL 生 成 结果 返回 ， 而 整个 RTL 模 板 不 再 产生 其 他 的 insn。FAIL 表 示 该 模板 失效 ， 此 时 编译 器 会 重新 选择 其 他 模板 进行 代码 生成 。 如 果 准 备 语句 中 既 没 有 使 用 DONE， 也 没有 使 用 FAIL， 那 么 该 
define_expand 就 像 通常 的 define_insn 一 样 进行 insn 生 成 。 




















一 个 define_expand 经 常会 在 准备 语句 中 调用 DONE 或 者 FAIL，RTL 模 板 部 分 也 可 以 简化 为 操作 数列 表 ， 如 图 8-3 所 示 。 
































例 8-9 SPUR 处 理 器 机 器 描述 文件 中 的 define_expand 应 用 








(define ехрапа "ashlsi3" 
[ (set (match орегапа: 81 0 "register operand" "") 
(ashift:SI 
(match орегапа:51 1 "register орегапа" "") 
(match operand:SI 2 "nonmemory орегапа" "")))] 


if (GET CODE (operands[2]) != CONST INT || (unsigned) INTVAL (operands[2]) > 3) 
FAIL; 





码 ， 











该 例子 描述 了 SPUR 处 理 器 上 进行 左 移 操作 ， 且 左 移 的 位 数 为 0~3 时 ， 则 使 用 RTL 模 板 生成 insn; 如 果 左 移 的 位 数 大 于 3， 则 超出 了 该 处 理 器 左 移 操作 指令 的 范围 ， 那 么 就 不 能 使 用 该 模板 进行 insn 的 生 





















































。 因 此 产生 FAIL， 用 来 通知 编译 器 使 用 其 他 的 模板 或 者 其 他 的 策略 (例如 ， 使 用 库 函 数 调用 ) 进行 insn 的 生成 。 





















































例 8-9 中 define_expand 模 板 的 名 称 为 “ashlsi3” ，RTL 模 板 部 分 则 定义 了 该 define_expand 所 处 理 的 RTL 形 式 ， 并 给 出 了 3 个 操作 数 所 要 满足 的 条 件 。 该 模板 中 条 件 部 分 为 空 ， 准 备 语 句 则 使 用 C 语 言 代 
对 操作 数 Operand[2] 进 行 了 判断 ， 表 示 该 移 位 操作 中 移 位 位 数 必须 是 整数 常量 ， 且 其 值 应 该 小 于 等 于 3。 









































例 8-10 zeroextension on the 68000 





(define expand "zero extendsidi2" 
[(set (match operand:DI 0 "nonimmediate орегапа" "") 
(zero_extend:DI (match орегапа:51 1 "nonimmediate ѕгс орегапа" "“)))1 
1 
if (СЕТ CODE (operands [0]) == МЕМ 686 СЕТ CODE (operands[1]) == МЕМ) 
operands [1] = force reg (SImode, operands[1]); 


H) 











如 果 编 译 器 在 命名 的 指令 模板 中 可 以 处 理 一 些 复杂 的 条 件 ， 那 么 就 直接 使 用 define_insn， 如 果 不 容易 处 理 ， 则 可 以 借助 define_expand 处 理 。 例 如 在 例 8-10 中 ， 需 要 完成 的 功能 是 将 操作 数 1 进行 

















zero_extend 后 的 值 存放 在 操作 数 0 中 ， 但 是 该 目标 机 器 不 支持 两 个 操作 数 都 是 内 存 地 址 的 形式 。 因 此 ， 当 两 个 操作 数 都 是 内 存 操作 数 时 ， 需 要 进行 额外 的 处 理 。 这 正 是 define_expand 的 优势 所 在 。 本 例 中 
的 处 理 就 是 在 准备 语句 中 通过 如 下 的 C 代 码 进 行 处 理 。 








if (СЕТ CODE (operands [0]) == МЕМ && СЕТ CODE (operands[1]) == МЕМ) 
operands[1] = force гед (SImode, operands[1]); 


} 












































在 这 段 C 代 码 中 ， 通 过 调用 函数 force_reg (SImode，operands[1]) 将 操作 数 1 转 换 成 一 个 寄存 器 变量 ， 并 用 该 变量 替换 原 有 的 操作 数 operands[1]。 在 函数 force_reg () 中 会 调用 emit_insn 产 生 一 条 

















新 的 insn， 此 时 ， 该 指令 模板 中 的 operands[1] 已 经 不 再 是 内 存 操作 数 ， 而 是 一 个 寄存 器 操作 数 ， 应 该 可 以 被 md 文件 中 由 define_insn 定 义 的 其 他 指令 模板 所 匹配 ， 并 生成 相应 的 insn。 


418-11 define_expand 中 内 部 操作 数 的 使 用 


(define _ expand "zero extendhisi2" 

[(set (match operand:SI 0 "register operand" "") 
(апа:51 (subreg:SI (match operand:HI 1 "register operand" "") 0) 
(match dup 2)))] 


"operands[2] = force гед (SImode, СЕМ ІМТ (65535)); " 
) 





例 8-11 给 出 了 一 个 使 用 内 部 操作 数 的 例子 。SPUR 处 理 器 上 进行 zero-extension 时 是 通过 将 操作 数 1 和 一 个 半 字 的 掩 码 (16 位 ) 进行 AND 运 算得 到 的 。 所 以 在 生成 该 zero-extension 指 令 之 前 ， 首 先 调 
force_reg 函 数 生成 一 条 指令 ， 该 指令 将 整数 0xffff 作 为 掩 码 保存 在 一 个 寄存 器 操作 数 中 ， 并 将 作为 zero-extension 指 令 的 第 2 操作 数 出 现在 insn 的 构造 过 程 中 ,该 寄存 器 操作 数 就 是 一 个 内 部 操作 数 。 




















例 8-12 аеҒіпе expand 及 define_insn 的 联合 使 用 


本 例 给 出 了 gcc/config/paag/paag.md 文 件 中 的 一 个 指令 模板 的 定义 : 





(define insn "addsi3" 
[(set (match operand:SI 0 "general орегапа" "") 
(plus:SI (match operand:SI 1 "general орегапа" "") 
(match operand:SI 2 "general орегапа" "")))] 


"ADD %0, %1, %2" 
[(set_attr "type" "arith") 
(ѕе attr "mode" "5І")1) 


该 模板 描述 了 目标 机 器 PAAG 上 处 理 加 法 的 一 条 指令 ， 表 示 的 语义 为 : 





operands[0]= operands[1]+ operands[2]; 





其 中 所 有 的 内 部 操作 数 的 机 器 模式 为 Simode， 匹 配 条 件 均 为 general operand， 也 就 是 说 ， 该 加 法 指令 可 以 完成 内 存 操作 数 、 寄 存 器 操作 数 、 立 即 数 中 任意 两 种 操作 数 之 间 的 加 法 运算 ， 并 将 结果 存储 
在 某 个 内 存 操作 数 或 者 寄存 器 操作 数 中 。 





假设 有 如 下 的 源 文件 : 





[GCC@localhost expandcfg]$ cat test.add.c 
int main(){ 
int а, Б, с; 

а- 1; 

р=а + 1; 

с=а +; 

return с; 


} 


编译 之 后 ， 生 成 的 部 分 汇编 指令 如 下 : 


站 对 应 于 b=at1; 

ADD -8 ($PTR1), -12($PTR1), 1 

7 对 应 于 c=atb; 

ADD -4($PTR1), -12($PTR1), -8 ($PTR1) 

















可 以 看 出 ， 上 述 两 条 指令 分 别 完 成 了 b=a+1 及 c=a+b 的 操作 ， 其 中 -8 ($PTR1) 表示 以 寄存 器 PTR1 为 基 址 寄存 器 ， 偏 移 量 为 -8 的 内 存 地 址 。 























考虑 另外 一 种 情况 ， 如 果 目 标 机 器 PAAG 的 加 法 指令 ADD С А B 支 持 的 操作 数 类 型 有 所 限制 ， 假 设 给 定 的 限制 如 表 8-9 所 示 (该 假设 不 一 定 合理 ,但 是 可 以 更 好 地 说 明 define_expand 的 作用 ) 。 


表 8-9 ADD operands[0]operands[1]operands[2] 


操作 数 操作 数 类 型 Ж x 
内 存 操作 数 
寄存 器 操作 数 


operands[0] 


内 存 操作 数 表示 operands[0] = operands[1] + 
operands[1] 寄存 融 操 作 数 operands[2] 
立即 数 


operands[2] 寄存 器 操作 数 


此 时 再 来 考虑 本 例 开头 给 出 的 指令 模板 ， 显 然 该 模板 中 关于 操作 数 2 的 匹配 断言 “general_operand” 就 不 适应 目标 机 器 上 关于 操作 数 的 要 求 了 ， 因 此 需要 对 该 模板 进行 修改 ， 修 改 后 的 指令 模板 为 : 

















(define insn "addsi3" 

І(вес (match operand:SI 0 "general орегапа" "") 
(Plus:SI (match operand:SI 1 "general орегапа" "") 
(match operand:SI 2 "register operand" "")))] 

"ADD %0, %1, %2" 

) 























但 遇 到 的 问题 是 ， 如 果 在 程序 代码 中 某 个 GIM PLE 语 句 转化 成 为 (set c (plus a b) ) 的 RTX 形式 ， 而 且 操作 数 b 的 类 型 是 立即 数 或 者 内 存 操作 数 时 ， 由 于 op2 不 满足 匹配 条 件 ， 因 此 ， 就 不 能 与 addsi3 
指令 模板 匹配 ， 此 时 ， 可 以 借助 define_expand 来 解决 这 个 问题 。 

















可 以 看 出 ， 程 序 代码 对 应 的 RTX 不 能 与 addsi3 指 令 模板 匹配 的 原因 是 操作 数 op2 不 满足 匹配 条 件 ， 因 此 ， 需 要 在 op2 为 立即 数 或 者 内 存 操作 数 时 进行 一 些 额外 的 处 理 ， 将 操作 数 op2 转 换 成 可 以 满足 
addsi3 模 板 所 要 求 的 形式 ， 这 个 处 理 过 程 就 可 以 利用 define_expand 实 现 。 






































利用 define_expand 定 义 如 下 两 条 指令 模板 : 








(define ехрапа "ада expand 1" 

(вес (match operand: SI 0 "general орегапа" "") 
(plus: SI (match operand: SI І "general operand" "") 
(match operand: SI 2 "immediate operand" "")))] 


" { operands[2] = деп тоу гед (орегапаѕ [2]); }" 


(define ехрапа "ада ехрапа п" 
[ (set (match орегапа: SI 0 "депега1 орегапа" "") 
(plus: SI (match орегапа: SI 1 "general operand" "") 
(match operand: 51 2 "memory орегапа" "")))] 


" { operands[2] = деп тоу гед (operands[2]); }" 


) 








上 述 两 条 指令 模板 分 别 对 形 如 (set с (plus a b) ) 的 rtx， 且 其 操作 数 b 分 别 为 立即 数 和 内 存 操作 数 的 情形 进行 了 处 理 。 处 理 的 思路 就 是 当 b 为 立即 数 或 者 内 存 操作 数 时 ， 对 该 操作 数 进 行 一 次 额外 
的 “扩展 (expand) ”操作 ， 即 将 该 操作 数 先 保存 到 一 个 寄存 器 中 ， 从 而 将 该 操作 数 转换 成 为 一 个 寄存 器 操作 数 。 当 然 ， 这 次 “额外 ”的 操作 需要 付出 代价 ， 即 在 函数 gen_mov _reg 中 需要 创建 一 个 寄存 
器 操作 数 ， 并 将 操作 数 operands[2] 复 制 到 该 寄存 器 操作 数 中 ， 该 操作 将 会 产生 一 条 额外 的 指令 ( 即 insn) ， 其 过 程 如 下 : 








rtx 
деп mov reg (гіх х) 


rtx temp = gen reg rtx (GET MODE (х)); 
еті move insn (temp, х); /* 产生 一 条 mov 指 令 */ 
return temp; 














通过 使 用 define_expand， 可 以 将 不 满足 指令 系统 中 操作 数 要 求 的 RTX 进 行 “ 扩 展 ”， 从 而 生成 可 以 被 define_insn 所 匹配 的 rtx 形 式 ， 进 一 步 生 成 insn。 























重新 使 用 新 的 md 文件 生成 编译 程序 ， 编 译 前 面 本 例 中 的 源 代码 ， 生 成 的 部 分 指令 如 下 : 








?7 对 应 于 b=at1; 

LA $0, #1 

ADD -8($PTR1), -12($PTR1), 50 
对 应 于 c=atb; 

МОУ 50, -8 ($PTR1) 

ADD -4 ($PTR1), -12($PTR1), 50 








将 两 种 情况 下 生成 的 代码 放 在 表 8-10 中 进行 对 比 ， 可 以 看 出 ， 对 于 b=a+1， 生 成 的 指令 包括 两 条 ， 第 一 条 是 由 define_expand"add_expand_i" 中 gen_mov гед (operands[2]) 所 生成 的 MOV 指 令 ， 
即将 立即 数 #1 移 入 寄存 器 $0 中 ; 第 二 条 指令 是 由 define_insn"addsi3" 模 板 所 匹配 生成 的 ， 其 中 op2 为 寄存 器 操作 数 ， 满 足 addsi3 指 令 模板 的 匹配 条 件 。 








对 于 c=a+b， 生 成 的 指令 也 包括 两 条 ， 第 一 条 是 由 define_expand"add_expand_m" 中 gen_mov гед (operands[2]) 所 生成 的 MOV 指 令 ， 即 将 内 存 操作 数 从 地 址 -8 ($PTR1) 移入 寄存 器 $0 中 ; 第 二 
条 指令 是 由 define_insn"addsi3" 模 板 所 匹配 生成 的 ， 其 中 op2 为 寄存 器 操作 数 ， 满 足 addsi3 指 令 模板 的 匹配 条 件 。 

















Ж8-10 使 用 define_expand 对 生成 指令 的 影响 


操作 不 使 用 define_epxand 使 用 define_expand 


МОУ 60, #1 
ADD -8($PTR1), -12($PTR1), $0 
МОУ $0, -8($PTR1) 
ADD -4($РТЕ1), -12($PTR1), $0 


b=a+1; ADD -8($PTR1), -12($PTR1), 1 


c=a+b; ADD -4($PTR1), -12($PTR1), -8($PTR 1) 








q 














从 这 个 例子 可 以 得 出 结论 ， 在 GCC 进行 insn 生 成 的 时 候 ， 如 果 给 定 的 RTX 模板 与 define_expand 模 板 相 匹配 ， 并 且 满 足 define_expand 中 的 条 件 语句 ， 则 通过 define_expand 模 板 中 的 准备 语句 对 匹配 
的 RTX 进行 操作 ， 并 可 能 产生 新 的 insn。define_expand 只 参与 insn 的 构造 ， 而 define_insn 既 参与 insn 的 构造 ， 也 会 参与 随后 的 汇编 代码 生成 。 




















另外 ， 需 要 特别 注意 的 是 ， 由 define_expand 模 板 所 生成 的 insn 必 须 与 define_insn 所 定义 的 某 个 RTL 模 板 所 匹配 ， 否 则 将 会 因 该 RTX 无 法 生成 指令 而 导致 编译 出 错 。 在 本 例 的 
define_expand"add_expand "Ж МБ, деп тоу _reg 所 生成 的 insn 将 会 与 nd 文件 中 定义 的 define_insn "movsi" 模 板 相 匹配 ， 该 模板 定义 如 下 : 














(define insn "тоуз1" 
[(set (match operand:SI 0 "general орегапа" "") 
(match орегапа:51 1 "general орегапа" ""))] 


"МОУ %0, %1" 





而 define_expand"add_expand_i" 中 RTL 模 板 所 生成 的 insn 则 会 与 define_insn"addsi3" 所 定义 的 模板 相 匹 配 。 


84 指令 拆 分 


在 某 些 特定 的 目标 机 器 中 ， 可 以 对 一 些 复杂 的 指令 模板 进行 分 解 (split) ， 即 将 一 个 复杂 的 指令 模板 分 解 成 多 个 简单 的 指令 模板 ， 从 而 生成 多 个 简单 的 insn。 











利用 define_split 可 以 完成 上 述 的 指令 模板 拆 分 功能 ，define_split 的 形式 如 下 : 





(define split 

insn-pattern] 

"condition" 

new-insn-pattern-1 

new-insn-pattern-2 

http: //www.hzcourse.com/resource/readBook?path=/openresources/teach_ebook/uncompressed/16037/0EBPS/Text/...] 
"preparation-statements" т 























该 模板 中 包括 4 个 部 分 ， 其 中 insn-pattern 为 需要 拆 分 的 RTL 模 板 ，condition 为 指令 模板 拆 分 的 最 后 条 件 ， 通 常 使 用 一 个 C 的 表达 式 进 行 描述 。 





第 三 部 分 为 拆 分 后 的 RTL 模 板 序列 ， 形 如 : 





[new-insn-pattern-1 
new-insn-pattern-2 
http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/16037/0EBPS/Text/...] 





即 拆 分 后 形成 的 多 个 指令 模板 ， 需 要 说 明 的 是 ， 拆 分 后 的 每 一 个 RTL 模 板 必须 与 md 文件 中 所 定义 的 某 个 define_insn 相 匹配 ， 否 则 将 会 导致 系统 崩溃 。 


最 后 一 部 分 为 preparation-statements， 即 准备 语句 ， 与 define_expand 中 的 准备 语句 类 似 ， 是 进行 拆 分 前 进行 的 必要 操作 。 














下 面 给 出 一 个 例子 , 说 明了 define_split 的 使 用 情况 。 








例 8-13 ”a29k.md 中 将 HiImode 符 号 扩展 为 SlImode 的 过 程 

















该 例子 中 使 用 define_split， 将 一 个 符号 扩展 的 RTX 拆 分 成 两 个 移 位 的 insn 模 板 。 


(define split 
[(set (match operand:SI 0 "деп гед орегапа" "") 
(sign extend:SI (match operand:HI 1 "деп гед орегапа" "")))] 
І(вес (match дир 0) (ashift:SI (match дир 1) (const int 16))) 
(set (match dup 0) (ashiftrt:SI (match dup 0) (const int 16)))] 
"{ operands[I] = деп lowpart (SImode, operands[1]); }™ 
) 





例 8-13 中 ， 需 要 匹配 的 指令 模板 为 : 








(вес (match operand:SI 0 "деп гед орегапа" "") 
(sign extend:SI (match operand:HI 1 "деп reg operand" ""))) 











该 RTL 模 板 表 达 的 语义 是 将 一 个 机 器 模式 为 HImode， 满 足 gen_reg_operand 条 件 的 操作 operands[1] 进 行 sign_extend 操 作 ， 并 将 结果 保存 到 机 器 模式 为 SIimode， 且 满足 gen_reg_operand 条 件 的 操 
作 数 operands[0] 中 。 


该 例 中 condition 部 分 为 空 ， 所 以 只 要 匹配 模板 匹配 成 功 ， 就 可 以 进行 指令 模板 的 拆 分 。 拆 分 后 的 指令 模板 序列 包含 两 条 指令 模板 ， 分 别 为 : 





(вес (match дир 0) (ashift:SI (match дир 1) (const int 16))) 
(set (match дир 0) (ashiftrt:SI (match дир 0) (const іпе 16))) 








准备 语句 为 : operands[1]=gen_lowpart (SImode，operands[1]) ; 表示 获取 操作 数 operands[1] 的 低 半 部 分 ， 并 生成 新 的 机 器 模式 为 Simode 的 操作 数 operands[1]。 








再 回头 来 看 split 后 的 insn 模 板 序列 ， 其 中 第 一 个 模板 表示 对 操作 数 operands[1] 左 移 16 位 ， 并 存放 在 operands[0] 中 ， 第 二 个 模板 的 意义 则 是 对 operands[0] 右 移 16 位 ， 与 原 模板 表示 的 意义 相同 。 


#18-14 mips.md 中 一 个 define_split 实 例 



































本 例 中 给 出 了 一 个 MIPS16 中 的 移 位 操作 ， 当 移 位 的 位 数 大 于 8 且 小 于 等 于 16 时 ， 通 常 的 移 位 操作 将 会 产生 一 条 4 字 节 的 指令 ， 如 果 采 用 define_split， 则 可 以 在 当 移 位 位 数 大 于 8 且 小 于 等 于 16 时 ， 将 同 
样 的 insn 拆 分 成 两 条 移 位 操作 ， 这 两 个 移 位 操作 的 移 位 位 数 将 均 小 于 等 于 8， 可 以 用 两 条 2 字 节 的 指令 分 别 给 出 。 























(define split 
[(set (match operand:GPR 0 "а орегапа") 
(any_shift:GPR (match operand:GPR 1 "а operand") 
(match operand:GPR 2 "const int operand")))] 
"TARGET МІР516 && reload completed && !TARGET DEBUG D MODE 
&& INTVAL (operands[2]) > 8 
&& INTVAL (operands[2]) <= 16" 
[(set (match dup 0) (any_shift:GPR (match dup 1) (const int 8))) 
(set (match dup 0) (any shift:GPR (match dup 0) (match dup 2)))] 
{ орегапаѕ [2] = СЕМ ІМТ {INTVAL (орегапаѕ[2]) - 8); }) ` 


在 MIPS16 中 ， 当 移 位 位 数 超过 8 时 ， 且 小 于 等 于 16 时 ， 将 会 产生 一 条 4 字 节 的 指令 ， 本 例 将 这 种 情况 下 的 RTX 拆 分 成 两 个 “ 较 小 ”的 移 位 RTX， 使 得 其 移 位 位 数 均 小 了 


令 表示 。 




















对 于 某 些 模板 ， 可 以 与 某 个 define_insn 相 匹配 ， 这 时 可 以 将 define_split 与 define_insn 合 二 为 一 ， 用 define іпѕп апа _split 来 描述 : 




















8， 因 此 ， 可 以 使 














2 字 节 的 指 





(define іпѕп апа split пате 
insn-pattern] | 
condition" 
"output-template" 
"split-condition" 
new-insn-pattern-1 
new-insn-pattern-2 


'preparation-statements" 
insn-attributes] 


http://www.hzcourse.com/resource/readBook?path=/openresources/teach ероок/опсопргеѕѕей/16037/0ЕВРЅ/Техі/...] 











018-15 асс/сопҒа/агт/агт.тааенпе іпѕп апа _split 实 例 


匹配 条 件 、 汇 编 指令 的 输出 模板 、split 条 件 、split 后 的 rtl 模 板 、 准 备 语句 及 





该 结构 稍微 复杂 ， 可 以 看 作 是 define_insn 与 define_split 的 一 个 组 合 。 它 包括 8 个 部 分 : 名 称 、 匹 配 的 RTL 模 板 、 指 令 模板 的 
令 的 属性 等 。 





(define insn апа split "*агт adddi3" 
[(set (match operand:DI 0 "5 register орегапа" "=&r,&r") 
(plus:DI (match operand:DI 1 "в register operand" "%0, 0") 
(match operand:DI 2 "в register operand" "r, 0"))) 
(clobber (reg:CC CC REGNUM))] 
"TARGET 32ВІТ && ! (TARGET HARD FLOAT 86 TARGET МАУЕКІСК)" /% 指令 模板 匹配 的 条 件 */ 
БН /* 汇编 指令 的 输出 模板 */ 
"TARGET 32ВІТ 86 reload completed" /* split 条 件 */ 
[ (Parallel [(set (reg:CC С CC REGNUM) 
(сопраге:СС С (plus:SI (match дир 1) (match дир 2)) 
(match dup 1))) 
(вес (match дир 0) (plus:SI (match дир 1) (match дир 2)))] 
(set (match dup 3) (plus:SI (ltu:SI (reg:CC C CC REGNUM) (const int 0)) 
g (plus:SI (match dup 4) (match dup 5))))1 
z /* 准备 语句 */ 


орегапаѕ [3] = деп highpart (SImode, operands[0]); 
operands [0] = деп lowpart (SImode, operands[0]); 
operands[4] = деп highpart (SImode, operands[1]); 
operands[1] = gen lowpart (SImode, operands[1]); 
operands[5] = gen highpart (SImode, operands[2]); 
operands[2] = деп lowpart (SImode, operands[2]); 

ү" 

[ (set_attr "conds" "clob") /* 属性 */ 


(set_attr "length" "8")] 
) 





如 果 在 32 位 系统 上 需要 进行 DImode (WF) 操作 ， 那 么 可 以 将 该 指令 split 拆 分 成 两 个 并 行 的 Simode 加 法 ， 并 对 其 低 32 位 加 法 的 进位 





进行 处 理 。 


8.5 Еа 


在 机 器 描述 文件 中 ， 通 常会 针对 不 同 的 机 器 模式 或 RTX_CODE 书 写 大 致 相似 的 指令 模板 。 为 了 避免 书写 的 复杂 ， 通 常 可 以 使 有 


86 ЖМ 
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LIIE (Реерһоо! Optimization) 是 一 种 


























或 者 整体 的 分 析 ， 进 行 指令 转换 ， 从 而 提升 代码 的 性 能 。 尽 管 这 些 代码 转换 很 局 部 、 很 小 ， 但 可 能 带 来 很 大 的 性 能 提升 。 


窥 孔 可 以 认为 是 一 个 滑动 窗口 


шр 
SS 


在 机 





(1 





器 描述 文件 中 ， 可 以 两 种 宕 孔 优化 的 方式 : 





， 编 译 器 在 实施 寅 孔 优化 时 ， 通 常 
































define_peephole: 优化 生成 汇编 代码 (RTL to Text Peephole Optimizers) ; 


(2) define_peephole2: 优化 生成 新 的 RTL (RTL to RTL Peephole Optimizers) 。 
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本 章 主要 介绍 了 GCC 中 机 器 描述 文件 $ftarget}.md 指 令 模板 的 基本 概念 及 其 
述 和 实例 说 明 。 这 些 内 容 对 于 理解 机 器 描述 文件 和 


小 结 

















新 型 目标 机 器 的 机 器 描述 。 


在 机 器 描述 文件 $ftarget}.md 中 ， 使 用 RT 




















${target}.c 文 件 中 定义 并 实现 。 





























第 9 章 ”机 器 描述 文件 $f{target}.[ch] 






































一 般 来 说 ，${target}.[ch] 文 件 主要 包含 表 9-1 所 示 的 与 目标 机 器 相关 的 内 容 : 


内 ж 
描述 目标 机 融 的 全 局 变量 
编译 驱动 及 选项 
存储 布局 
寄存 天 使 用 
堆栈 布局 
寻 址 方式 
汇编 代码 格式 





9.1 targetm 


struct gcc target targetm 是 一 个 描述 目标 机 器 的 结构 体 ， 定 义 在 target.h 文 件 中 。 该 结构 异常 复杂 ， 包 含 了 众多 的 成 员 变 量 ， 圳 括 了 与 汇编 代码 输出 、 指 令 调 度 、 向 量化 、 函 数 参数 传递 、 函 数 返 





表 9-1 机 器 描述 文件 ${target}.[ch] 文 件 的 主要 内 容 


主要 作用 





定义 全 局 变 1 
定义 与 目标 系统 相关 的 编译 选项 等 

字 节 、 字 的 大 小 端 问题 ， 各 种 类 型 数据 的 存储 大 小 、 存 储 对 齐 方式 等 
寄存 器 数量 、 名 称 、 类 型 以 及 寄存 器 分 配 顺 序 等 

堆栈 的 增长 方式 、 对 齐 方式 、 活 动 记录 的 格式 等 

目标 机 器 支持 的 寻 址 方式 

目标 系统 汇编 代码 的 输出 格式 等 


r targetm 


以 及 其 他 大 量 与 目标 机 器 相关 的 信息 ， 这 些 信息 大 多 以 函数 指针 和 宏 定 义 的 方式 给 出 。 


struct gcc target targetm 的 初始 化 在 $ftarget}.c 文 件 中 完成 ， 一 般 使 用 如 下 语句 进行 初始 化 : 


枚 举 器 进行 指令 模板 的 简化 。 枚 举 器 包括 mode 枚 举 器 和 code 枚 举 器 。 


局 部 优化 方式 ， 编 译 器 仅仅 在 一 个 基本 块 或 者 多 个 基本 块 中 ， 针 对 已 经 生成 的 代码 ， 结 合 CPU 指 令 的 特点 ， 通 过 一 些 认为 可 能 带 来 性 能 提升 的 转换 规则 ， 


只 分 析 这 个 窗口 内 的 指令 。 每 次 转换 之 后 ， 可 能 还 会 暴露 相 邻 窗口 之 间 的 某 些 优化 机 会 ， 所 以 可 以 多 次 调用 寅 孔 优 化 ， 尽 可 能 提升 性 


要 内 容 ， 并 对 机 器 描述 文件 中 define_insn、define_expand、define_split、define_peephole 等 主要 操作 进行 了 详细 的 描 
户 机 器 描述 文件 至 关 重 要 。 在 将 GCC 移植 到 新 的 目标 机 器 时 ， 用 户 可 以 参考 一 些 架构 相近 的 机 器 描述 文件 ， 从 简 到 繁 ， 由 粗 到 细 ， 逐 层 深 化 ， 从 而 完成 


L 对 目标 机 器 的 指令 生成 进行 了 详细 的 描述 。 然 而 ， 对 于 目标 机 器 来 讲 ， 仍 然 有 大 量 的 信息 无 法 使 用 RTL 进 行 描述 ， 例 如 寄存 器 信息 、 存 储 布局 信息 以 及 一 些 与 


硬件 相关 的 函数 实现 等 。 因 此 ， 这 些 信息 就 使 用 C 语 言 进行 描述 ， 其 中 大 部 分 被 设计 成 宏 定义 ， 并 包含 在 ${ftargetj.h 文 件 中 ， 而 机 器 描述 文件 中 所 使 用 的 一 些 函 数 以 及 一 些 与 目标 机 器 相关 的 函数 则 大 多 在 








回 











struct асс target targetm = ТАҚСЕТ INITIALIZER; 








当 目标 机 器 的 特性 与 gcc_target 默 认 的 初始 化 值 不 一 致 时 ， 可 以 先 重新 定义 这 些 宏 ， 最 后 调 


其 中 ， 宏 定义 TARGET_ INITIALIZER 在 target-def.h 中 声明 ，TARGET_INITIALIZER 又 由 一 系列 小 的 宏 定义 组 成 ， 分 别 对 struct gcc_target 数 据 结构 的 成 员 进行 初始 化 。 



































struct асс target targetm = ТАҚСЕТ INITIALIZER; 


完成 目标 系统 的 初始 化 。 


9.2 ”编译 驱动 及 选项 



































GCC 实际 上 是 一 个 编译 驱动 程序 (Compilation Driver) ， 它 通过 调用 一 系列 的 其 他 程序 来 完成 编译 、 汇 编 以 及 链接 等 工作 。 通 常情 况 下 ， 如 图 9-1 所 示 ，C 语 言 的 编译 阶段 由 GCC 编 译 出 的 cc1 程 序 完 
成 ， 汇 编 过 程 由 GNU binutils 中 的 as 程 序 完 成 ， 而 最 终 的 链接 过 程 一 般 由 GNU binutils 中 的 ld 完成 。 























源 代码 一 >| ЙЕЛ | 可 执行 程序 


cel 





图 9-1 ”GCC 编译 驱动 
































因此 ，GCC 需 要 对 其 命令 行 参数 进行 解析 ， 从 而 根据 命令 参数 判断 需要 调用 哪些 程序 ， 以 及 向 这 些 程序 传递 什么 样 的 命令 行 参数 。 为 了 完成 这 些 功 能 ，GCC 中 定义 了 SPEC 字 符 串 ， 用 来 描述 GCC 给 这 
些 程序 所 传递 的 参数 。 典 型 的 情况 下 ， 对 于 GCC 可 以 调用 的 程序 ， 均 有 一 个 SPEC 字 符 串 与 之 对 应 ， 但 也 有 特殊 情况 ， 有 些 程序 可 能 需要 多 个 SPEC 字 符 串 来 控制 其 运行 。GCC 代 码 中 已 经 内 建 了 一 些 SPEC 字 
符 串 (大 多 在 gcc/gcc.c 中 定义 ) ， 用 户 可 以 在 GCC 的 命令 行使 用 “-specs=” 选 项 来 指定 新 的 SPEC 文 件 ， 用 来 覆盖 GCC 内 建 的 9?PEC 值 ， 也 可 以 使 用 -dumpspecs 选 项 来 查看 GCC 使 用 的 SPEC 描 述 信息 。 







































































另外 ， 目 标 处 理 器 一 般 还 有 一 些 与 目标 机 器 相关 的 特定 编译 选项 ， 可 以 使 用 man gcc 查 看 很 多 与 目标 机 器 相关 的 编译 选项 ， 这 些 编译 选项 就 是 在 机 器 描述 文件 的 $ftarget}.[ch] 文 件 中 给 出 的 。 























例如 ， 对 于 ARC 处 理 器 ， 使 用 man gcc 就 可 以 显示 如 下 与 ARC 处 理 器 相关 的 编译 选项 : 

















АВС Options 
-EB -EL -mmangle-cpu -mcpu=cpu -mtext=text-section -mdata=data-section -mrodata= readonly-data-section 









































编译 选项 有 的 用 字符 表示 ， 有 的 选项 带 有 参数 ， 有 的 选项 则 用 单词 表示 ， 同 时 有 些 编译 选项 之 间 有 一 定 的 关系 。 例 如 -EB 和 -EL 两 个 选项 就 不 能 同时 使 用 ， 因 为 -EB 表示 以 大 端 形式 编译 ， 而 -EL 则 表示 以 
小 端 形式 编译 ， 所 以 GCC 需 要 判断 用 户 编译 选项 的 合法 性 。 机 器 相关 的 编译 选项 一 般 定 义 在 $ftarget}.h 文 件 中 。 




















93 ”存储 布局 








存储 布局 (storage layout) 主要 定义 了 目标 机 器 中 数据 存储 的 格式 、 大 小 、 对 齐 方 式 等 内 容 。 

















94 ”寄存 器 使 用 





























本 节 主 要 定义 了 目标 机 器 中 的 寄存 器 用 法 (Register Usage) ， 包 括 目标 机 器 中 物理 寄存 器 的 数量 、 寡 存 器 的 初始 化 、 寡 存 器 分 配 顺序 、 寡 存 器 在 函数 调用 时 是 否 需要 保存 、 寡 存 器 名 称 、 寡 存 器 类 型 
等 。 











9.5 “堆栈 及 函数 调用 规范 描述 











堆栈 是 一 种 特殊 的 数据 结构 ， 其 先进 后 出 的 特性 经 常 被 用 于 函数 调用 的 现场 保存 和 恢复 。 在 机 器 描述 文件 中 ， 通 常 要 对 堆栈 的 增长 方向 、 堆 栈 的 布局 以 及 一 些 描述 堆栈 地 址 的 寄存 器 进行 设置 。 


















































GCC 中 函数 调用 时 使 用 的 堆栈 空间 被 称 为 栈 帧 (Frame 或 Stack Frame) ， 可 以 看 作 是 编译 理论 书籍 中 经 常 提 到 的 函数 活动 记录 (Active Record, AR) 的 一 种 实现 形式 ， 通 常用 来 保存 函数 调用 时 的 
函数 参数 、 返 回 地 址 及 特殊 寄存 器 等 ， 同 时 也 为 函数 的 局 部 变量 ( 即 自动 变量 ， 文 中 不 加 区 分 ) 分 配 存储 空间 。 从 本 质 上 来 看 ， 栈 帧 就 是 为 了 实现 函数 调用 和 函数 返回 而 对 堆栈 空间 进行 的 一 种 逻辑 组 织 方 
式 。 

























































































在 进行 函数 调用 前 ， 一 般 需 要 首先 将 函数 调用 的 传 入 参数 (Incoming Argument) 传 入 参数 寄存 器 或 压 入 堆栈 ， 该 操作 一 般 在 函数 调用 者 (Caller) 的 栈 帧 中 进行 ， 然 后 为 被 调用 的 函数 (Callee) 创 
建 栈 帧 ， 并 将 函数 调用 的 返回 地 址 、 调 用 者 的 特殊 寄存 器 内 容 等 保存 在 栈 帧 中 ; 另外， 还 需要 为 被 调用 函数 的 局 部 变量 及 其 调用 其 他 函数 的 传 出 参数 (Outgoing Argumnet) 分 配 空间 。 当 被 调用 函数 执 
行 完毕 后 ， 则 需要 从 栈 帧 中 读 取保 存 的 寄存 器 值 、 返 回 地 址 等 ， 从 而 恢复 上 层 函 数 的 栈 帧 ， 完 成 函数 调用 的 返回 操作 。 



























































































































































假设 函数 m 调 用 函数 f， 函 数 f 又 进一步 调用 函 数 g， 在 执行 函数 g 时 ， 堆 栈 中 各 个 函数 的 栈 帧 结构 通常 如 图 9-4 所 示 (假设 该 机 器 中 均 使 用 堆栈 传递 函数 参数 ， 且 堆栈 向 较 低地 址 方向 增长 ) 。 






































地 
返回 地 址 及 上 层 栈 帧 信息 减 


б 小 
的 栈 帧 


参数 访问 基地 址 ARG POINTER 
硬件 栈 帧 起 始 地 址 HARD FRAME POINTER 


Еа ыш 
局 部 变量 访问 基地 址 FRAME POINTER 


的 栈 帧 


栈 帧 结束 地 址 STACK POINTER 


РА о 
的 栈 帧 





图 9-4 ”函数 栈 帧 的 一 般 结 构 

















需要 说 明 的 是 ， 针 对 不 同 的 目标 机 器 ， 由 于 其 指令 系统 和 函数 调用 规范 的 不 同 ， 栈 帧 的 实现 可 能 是 不 同 的 ， 但 其 包含 的 内 容 基本 形 同 ， 大 多 是 其 组 织 形式 不 完全 相同 。 从 图 9-4 可 以 看 出 ， 一 个 函数 的 栈 
山 主 要 包含 了 如 下 的 信息 : 
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(1) 函数 返回 到 调用 者 的 返回 地 址 ; 




















(2) 函数 调用 者 栈 帧 的 信息 ， 通 常 是 指 其 栈 帧 的 基地 址 ; 





(3) 函数 执行 时 需要 保存 的 特殊 寄存 器 ; 























(4) 函数 所 使 用 的 局 部 变量 ; 


























(5) 该 函数 调用 其 他 函数 时 的 调用 参数 等 。 


























对 上 述 函 数 栈 帧 的 内 容 进行 寻 址 访问 时 ， 经 常 需要 知道 当前 函数 栈 帧 的 基地 址 、 当 前 函数 栈 帧 的 栈 项 地 址 、 参 数 区 域 的 基地 址 、 局 部 变量 的 基地 址 、 该 函数 调用 其 他 函数 时 参数 区 域 的 基地 址 等 关键 信 
息 ， 这 些 信息 与 目标 机 器 实现 栈 帧 的 方式 及 支持 栈 帧 实现 的 硬件 结构 有 关 ， 尤 其 是 一 些 专用 寄存 器 的 使 用 ， 例 如 ARG_POINTER、HARD FRAME_POINTER、FRAME_POINTER 和 STACK_POINTER 寄 存 器 
等 。 



































96 ШЕҢ 











本 节 给 出 的 宏 定义 主要 描述 目标 处 理 器 寻 址 时 所 需要 进行 的 处 理 ， 尤 其 是 内 存 寻 址 时 地 址 的 有 效 性 验证 。 其 主要 包括 如 下 几 个 宏 定义 的 声明 : 








НАУЕ PRE INCREMENT [Macro] 
НАУЕ РВЕ DECREMENT [Macro] 
. HAVE POST INCREMENT [Macro] 
. HAVE POST DECREMENT [Macro] 


њо № 





上 述 4 个 宏 定 义 的 表达 式 返 回 结果 如 果 为 非 零 ， 则 表示 目标 机 器 支持 pre-increment、pre-decrement、post-increment 和 post-decrement 的 寻 址 方式 。 





5. СОМЅТАМТ _ ADDRESS Р (х) [Macro] 





一 个 表达 式 ， 如 果 常 量 RTX x 可 以 作为 一 个 合法 的 地 址 ， 则 返回 1。 





例 9-28 gcc/config/i386/i386.h 中 CONSTANT_ADDRESS_P 的 定义 





#define CONSTANT ADDRESS Р(Х) constant address р (Х) 





在 gcc/config/i386/i386.c 中 定义 了 constant_ address_p 函 数 : 





bool 
constant address p (rtx x) 


return CONSTANT Р (х) && legitimate address р (Рподе, х, 1); 











可 见 ， 在 i386 中 判断 一 个 常量 x 是 否 为 一 个 合法 的 内 存 地 址 ， 则 需要 满足 两 个 条 件 ， 即 x 必须 是 一 个 常量 ， 而 且 RTX x 表示 一 个 合法 的 地 址 。 





什么 是 一 个 合法 的 地 址 表示 呢 ? 这 就 是 函数 legitimate_address р (Ртоде, х, 1) 所 完成 的 功能 。 











一 般 来 讲 ，x86 的 内 存 寻 址 在 指令 中 可 以 表示 为 如 下 的 通用 格式 : 











disp (Фразе, %index, scale) 





它 所 表示 的 地 址 ADDRESS 可 以 按照 如 下 的 公示 计算 : 





ADDRESS = disp + base + scale * іпдех 





БІ 





必 表 示 一 个 合法 的 地 址 。 该 函数 的 实现 请 参见 gcc/config/i386/i386.c。 


ж 


其 中 ，disp 和 scale 必 须 是 常数 ，base 必 须 是 合法 的 基 址 寄存 器 ，index 必 须 是 合法 的 索引 寄存 器 。 


数 legitimate_address р (Ртоде, х, 1) 就 是 将 RTX x 进行 拆 分 ， 并 判断 x 是 否 可 以 表达 成 为 disp (%base、%index、scale) 的 形式 。 如 果 不 能 表示 ， 则 不 是 一 个 合法 的 地 址 表示 ; 如 果 拆 分 成 





6. MAX REGS PER ADDRESS [Macro] 





一 个 合法 地 址 中 能 够 出 现 的 寄存 器 的 最 多 数目 。 


例 9-29 gcc/config/i386/i386.h 中 MAX_REGS_PER_ADDRESS 的 定义 





#define MAX REGS PER ADDRESS 2 





这 个 也 可 以 从 例 9-29 中 关于 i386 寻 址 的 描述 中 得 到 验证 ， 即 i386 中 一 个 合法 的 内 存 地 址 中 最 多 可 以 包含 一 个 基 址 寄存 器 和 一 个 索引 寄存 器 。 





7. REG MODE OK FOR BASE P(X, MODE) 
8. ВЕС MODE OK РОК INDEX Р(Х, MODE) 














上 述 两 个 宏 定义 主要 用 来 判断 rtx X 是 否 为 合法 的 基地 址 寄存 器 和 索引 寄存 器 。 














9. СО IF LEGITIMATE ADDRESS (mode, х, label) [Macro] 


该 宏 定义 为 一 个 包含 了 label 的 复合 语句 。 当 机 器 模式 为 mode 的 操作 数 x 是 一 个 合法 的 内 存 地 址 时 ， 则 执行 goto label, 


例 9-30 ”gcc/config/i386/i386.h 中 GO_IF_LEGITIMATE_ADDRESS 的 定义 





#ifdef REG OK STRICT 
#define СО ТЕ LEGITIMATE ADDRESS (MODE, Х, ADDR) 
ао { 
if (legitimate address р ((МОрЕ), (X), 1)) 
goto ADDR; 
} while (0) 
#else 
#define СО ТЕ LEGITIMATE ADDRESS (MODE, X, ADDR) 
do { 
if (legitimate_address_p ((MODE), (X), 0)) 
goto ADDR; 
} while (0) 
#endif 


AAAA 


астыға 





为 目标 机 器 上 可 








可 以 看 出 ， 本 定义 中 也 使 用 了 函数 legitimate_address р (enum machine mode mode、rtx addr、int strict) ， 用 来 判断 x 是 否 为 一 个 有 效 的 内 存 地 址 。 其 中 最 后 一 个 参数 strict 为 1 时 ， 需 要 对 基地 
址 寄存 器 base 和 索引 寄存 器 index 分 别 使 用 REG_OK_FOR_BASE_STRICT_P (base) 和 REG_OK_FOR INDEX STRICT P (index) 进行 判断 ， 即 寄存 器 base 和 index 是 否 为 目标 机 器 上 合法 的 基 址 寄存 器 和 
索引 寄存 器 。 














如 果 strict 为 0 时 ， 需 要 对 基地 址 寄存 器 和 索引 寄存 器 分 别 使 用 REG_OK_FOR_BASE МОМЅТАІСТ Р (base) 和 REG_OK_FOR INDEX_NONSTRICT_P (index) 进行 判断 ， 即 寄存 器 base 和 index 是 否 




















其 他 的 与 寻 址 相关 的 宏 定 义 请 参见 gccinternals。 


97 汇编 代码 分 区 


GCC 编译 系统 生成 的 目标 机 器 汇编 文件 一 般 由 各 种 不 同类 型 数据 的 节 区 (Section) 组 成 。 例 如 ， 常 见 的 .text 节 区 用 来 保存 指令 和 只 读 的 数据 ，.data 节 区 上 
存放 未 初始 化 的 数据 等 。 因 此 ， 在 编译 的 汇编 代码 生成 阶段 需要 生成 相应 的 节 区 信息 ， 便 于 后 续 汇 编 器 (如 GNU as) 和 链接 器 (如 GNU 1а) 的 

















的 基 址 寄存 器 和 索引 寄存 器 ， 此 时 base 和 index 可 以 是 虚拟 寄存 器 。 参 见 9.4.4 节 相关 内 容 。 




















Linux 系 统 中 目标 文件 支持 多 种 格式 ， 最 常见 的 为 ELF (Executable and Linkable Format) 格式 ， 关 于 ELF 文 件 的 格式 ， 尤 其 是 节 
装载 与 库 》 一 书 的 描述 。 下 面 的 讨论 以 ELF 目 标 文 件 为 例 。 





首先 通过 一 个 例子 说 明 ELF 文 件 中 节 区 的 信息 。 


例 9-31 汇编 代码 中 的 节 区 信息 





假设 有 如 下 的 源 代码 : 




















工作 。 





区 的 详细 文档 ， 可 以 参考 ELF 文 档 及 《程序 员 的 

















来 存放 已 初始 化 的 可 写 数 据 ，.bss 节 区 用 来 























我 修养 一 一 链接 、 





[GCC@localhost asm]$ cat test.c 
int і = 0х11223344; 
int j = 0; 
char зіг1[64]={"Тһіѕ із а string."}; 
char ѕіг2 [128]; 
int таіп() { 
int 
к= +1; 
strcpy (5012, "Test string to Бе соріеа."); 
printf ("%s\n", strl); 
return k; 








该 文件 中 定义 了 全 局 变量 i、j、str1 及 str2， 其 中 int 初始 化 为 0x11223344，int |9 848230, FE 





Bstr1 初 始 化 为 “This is a string.”， 而 字符 串 str2 示 初始化， 另外， 函数 main 中 还 定义 了 局 部 变量 





















































k。 在 GCC 对 该 代码 进行 汇编 的 过 程 中 ， 将 根据 变量 类 型 及 初始 化 的 情况 ， 分 别 将 这 些 变量 编译 到 不 同 的 节 区 中 。 
首先 查看 生成 的 汇编 代码 : 
[GCC@localhost asm]$ асс -S test.c 
[GCCQlocalhost asm]$ cat test.s 
:file "test.c" 
globl і 
.data ; 由 于 的 初 值 为 0x11223344， 因 此 将 全 局 变量 i 保存 在 节 区 .data 中 
.align 4 
.type і, @орјесі 
size i, 4 
i; 
.long 287454020 
41051 j 
.bss ; 由 于 j 的 初 值 为 0， 因 此 将 全 局 变量 j 保 存在 节 区 .bss 中 
align 4 
‚суре j, @object 
size 1,4 
БІН 
. Zero 4 
.globl str1 
.data 
7 由 于 str1 的 初 值 为 字符 串 "This is a string."， 因 此 将 全 局 变量 str1 保 存在 节 区 .data 中 
.align 32 
уре strl, @object 
.Size strl, 64 
strl: 
string "This із а зігіпд." 
.Zero 46 
. comm str2, 128,32 
; 由 于 str2 未 进行 初始 化 ， 因 此 将 全 局 变量 str2 声 明 为 common 类 型 的 符号 ， 等 候 链 接 时 再 分 配 空间 
.Section .rodata 
; 由 于 字符 串 " Test string to be copied." 为 只 读 常量 ， 因 此 保存 在 节 区 .rodata 中 ， 并 以 符号 LC0 进 行 引用 
.1С0: 
.String "Test string to be copied." 
.text ; main 函 数 的 执行 代码 ， 分 配 在 节 区 .text 中 
.globl main 
.Еуре main, @function 
main: 
pushl %ерр 
movl Февр, Ферр 
апа1 5-16, Фезр 
subl 532, %esp 
movl i, edx 
movl 3, Зеах 
1еа1 (Фейх, %еах), Феах 
movl Зеах, 28 (%esp) 
movl 526, 8(Февр) 
movl 5.1С0, 4(%еѕр) 
movl $str2, (%esp) 
call memcpy 
movl $strl, (%esp) 
call puts 
movl 28 (esp), %еах 
leave 
ret 
.Size main, .-шаіп 
.ident "GCC: (GNU) 4.4.7 20120313 (Кеа Hat 4.4.7-11)" 
„section .note.GNU-stack, "", @progbits ; 定义 节 区 .note.GNU-stack 
该 汇编 文件 中 ， 指 定 节 区 的 伪 指 令 (有 的 文献 中 也 称 为 伪 操 作 ) 包括 : 
.text 
.data 
.bss 
.Section .rodata 
它 是 通过 机 器 描述 文件 中 相应 的 宏 定义 来 描述 的 ， 主 要 的 节 区 伪 指 令 宏 定义 如 表 9-12 所 示 。 
表 9-12 汇编 代码 中 节 区 伪 指 令 的 宏 定义 
+ ESN yz г 
ИГ ЕТТІ 
、 ЕТЕ 
代码 节 区 ТЕХТ _ SECTION АЅМ ОР .text 
ы ту ИЕ 
已 初始 化 的 可 写 数据 节 区 РАТА ЗЕСТІОМ ASM ОР .data 
д Я ЕТЕ 
未 初始 化 数据 节 区 BSS_SECTION А5М ОР .bss 
2:5 Ж н 
只 读数 据 节 区 READONLY РАТА SECTION ASM ОР .rodata 
上 述 这 些 节 区 伪 指 令 的 初 值 一 般 是 在 gcc/varasm.c 中 通过 init_varasm_once 函 数 调用 get_unnamed_section 函 数 完成 设置 的 ， 其 中 就 使 用 了 表 9-12 中 给 出 的 宏 定义 。 例 如 在 gcc/config/i386/unix.h 中 
就 有 如 下 的 宏 定义 





/* 代码 节 区 的 伪 指 令 */ 

#define ТЕХТ SECTION ASM OP "\t.text" 
/* 已 初 始 化 的 可 写 数据 节 区 的 伪 指 令 */ 
#define DATA SECTION ASM OP "\t.data" 
/* 未 初始 化 数据 节 区 的 伪 指 令 */ 

#define BSS_SECTION ASM OP "\t.bss" 





在 gcc/config/elfos.h 中 有 如 下 的 宏 定 义 : 





/ж 只 读数 据 节 区 的 伪 指 令 */ 


#define READONLY DATA SECTION ASM OP "\t.section\t.rodata" 





































































































这 些 值 就 决定 了 上 述 汇编 代码 中 节 区 伪 指 令 的 字符 串 取 值 。 

在 特定 的 目标 机 器 描述 文件 中 ， 也 可 以 根据 目标 机 器 所 支持 的 汇编 指令 格式 ， 重 新 定义 这 些 宏 定义 。 

为 了 读者 更 清楚 地 理解 节 区 的 意义 ， 作 为 补充 ， 下 面 接 着 讲 讲 后 续 发 生 的 事情 。 

在 汇编 代码 生成 之 后 ，GCC 进 一 步调 用 GNU as 进 行 该 汇编 代码 的 汇编 处 理 ， 生 成 可 重 定位 的 ELF 目 标 文件 。 可 以 使 用 readelf 工 具 查 看 该 目标 文件 中 的 节 区 信息 。 
19-32 ”ELF 目 标 文件 中 的 节 区 信息 











[6СС@1оса1ћоѕі asm]$ ав test.s /* 调用 as 将 test.s 汇 编 成 ELF 目 标 文件 test.o */ 
[GCC@localhost asm]$ readelf -S test.o /* 查看 test.o 中 的 节 区 信息 */ 

There аге 11 section headers, starting at offset 0х17с: 

Section Headers: 











[Nr] Name Type Addr off Size ES Flg Lk Inf Al 
[ 0] NULL 00000000 000000 000000 00 о оо 
[ 1] .text PROGBITS 00000000 000034 000049 00 АХ 0 0 4 
[ 21 .rel.text REL 00000000 00044c 000038 08 9 1 4 
[3] „баба PROGBITS 00000000 000080 000060 00 МА 0 0 32 
[ 4] .bss МОВІТ5 00000000 0000е0 000004 00 ЖА 0 0 4 
[ 5] .rodata PROGBITS 00000000 0000e0 000014 00 А 0 01 
[ 6] .comment PROGBITS 00000000 0000fa 00002е 01 MS 0 0 1 
[ 7] .note.GNU-stack РЕОСВІТ5 00000000 000128 000000 00 0.01 
[ 8] .shstrtab 5ТЕТАВ 00000000 000128 000051 00 0.01 
[ 9] .symtab БҮМТАВ 00000000 000334 0000Ғ0 10 10 8 4 
(101 .strtab STRTAB 00000000 000424 000027 00 0.01 
Key to Flags: 
W (write), A (alloc), Х (execute), М (merge), 5 (strings) 
I (info), L (link order), G (group), x (unknown) 
О (extra OS processing required) о (05 specific), р (processor specific) 
其 中 .text 节 区 的 信息 为 : 
[Nr] Name Type Адас off Size ES Flg Lk Inf Al 


[ 1] .text PROGBITS 00000000 000034 000049 00 AX 0 0 4 

















其 中 包含 main 函 数 中 描述 的 指令 部 分 ， 该 部 分 的 指令 使 用 objdump 命 令 反 汇编 后 为 : 














[GCC@localhost asm]$ objdump -d test.o 
test.o: file format е1#32-1386 
Disassembly of section .text: 

00000000 <main>: 


0: 55 push Ферр 

1% 89 е5 шоу Фезр,Ферр 

з: 83 е4 f0 апа S$Oxfffffff0, %еѕр 
83 ec 20 sub $0x20, Sesp 

9: 8b 15 00 00 00 00 mov 0x0, %едх 

f: al 00 00 00 00 mov 0x0, %еах 

14: ва 04 02 1еа (%еах,%еах,1),%еах 
227% 89 44 24 1с шоу Ѕеах, 0х1с (%еѕр) 
10: с7 44 24 08 1а 00 00 movl $0х1а, 0х8 (esp) 
22: 00 

23: с7 44 24 04 00 00 00 movl 50х0,0х4 (%еѕр) 
2а: 00 

2р: с7 04 24 00 00 00 00 movl 50х0, (sesp) 

32: е8 fc ҒҒ ҒҒ ff call 33 <таіп+0х33> 
37: с7 04 24 00 00 00 00 movl 50х0, (sesp) 

Зе: е8 fc ҒҒ ҒҒ ff call 3f <main+0x3f> 
43: 8b 44 24 1c mov Охіс(Фезр),Феах 
47: с9 leave 

48: с3 теі 











其 占有 的 节 区 大 小 为 0x49 字 节 ， 与 节 区 表 中 给 出 的 .text 节 区 的 大 小 一 致 。 








再 来 查看 .data 节 区 的 信息 : 
[Nr] Name Туре Addr ОТЕ Size ES Flg Lk Inf Al 
[ 3] .data PROGBITS 00000000 000080 000060 00 wA 0 0 32 

















.data 节 区 中 保存 了 汇编 代码 中 定义 的 符号 和 符号 str1 的 数据 ， 其 中 的 大 小 为 4 字 节 ，str1 的 大 小 为 64 字 节 ， 由 于 str1 以 32 字 节 对 齐 的 原因 ， 所 以 变量 i 后 有 32-4=28 个 字 节 属于 填充 内 容 ， 该 节 区 总 的 大 
小 为 32+64=96 个 字 节 ， 即 0x60 个 字 节 。 该 节 区 的 内 容 也 可 以 通过 hexdump 工 具 显 示 。 


























[GCC@localhost asm]$ hexdump -C -s 128 -n 96 test.o 

00000080 44 33 22 11 00 00 00 00 00 00 00 00 00 00 00 00 |D3"http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/16037/0EBPS/Text/..http:/ 
/% i 的 值 0x11223344， 占 用 4 字 节 */ кі 

00000090 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 |http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/16037/0EBPS/Text/..http://w 
/* 工 后 28 字 节 为 填充 内 容 */ 

000000а0 54 68 69 73 20 69 73 20 61 20 73 74 72 69 бе 67 |Тһі5 is а string| 

ж 字符 囊 sStzl1 的 值 ， 占 用 64 字 节 */ 

000000b0 2e 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 |http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/16037/0EBPS/Text/..http://w 
000000с0 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 |http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/16037/0EBPS/Text/..http://w 
ж 


000000е0 






































再 来 分 析 .bss 节 区 的 信息 。.bss 节 区 的 大 小 4 字 节 ， 描 述 了 源 代码 中 全 局 变量 j 的 初 值 为 0。 该 节 区 只 有 大 小 信息 ， 而 在 ELF 文 件 中 并 不 占用 实际 的 存储 空间 。 





[Nr] Мате Type Addr off Size ES Flg Lk Inf Al 
[ 4] .bss NOBITS 00000000 0000е0 000004 00 ЖА 0 0 4 























至 于 汇编 代码 中 的 全 局 变量 str2， 由 于 该 符号 编译 时 被 设置 为 .comm 符 号 ， 该 符号 在 符号 表 节 区 .symtab 中 予以 描述 ， 在 后 续 的 链接 过 程 中 ， 通 常 .comm 符 号 会 被 合并 到 .bss 节 区 中 ， 从 而 为 其 分 配 存 
储 空间 。 可 以 使 用 readelf 查 看 该 目标 文件 中 的 符号 信息 。 


























[GCC@localhost asm]$ readelf -s test.o 
Symbol table '.symtab' contains 15 entries: 
Num: Value Size Type Bind Vis Ndx Name 


0: 00000000 0 МОТҮРЕ LOCAL DEFAULT UND 

1: 00000000 0 FILE LOCAL DEFAULT ABS test.c 
2: 00000000 0 SECTION LOCAL DEFAULT 1 

3: 00000000 0 SECTION LOCAL DEFAULT 3 

4: 00000000 0 SECTION LOCAL DEFAULT 4 

5: 00000000 0 SECTION LOCAL DEFAULT 5 

6: 00000000 0 SECTION LOCAL DEFAULT 7 

7: 00000000 0 SECTION LOCAL DEFAULT 6 

8: 00000000 4 OBJECT GLOBAL DEFAULT Fi 

9: 00000000 4 OBJECT GLOBAL DEFAULT 4j 

10: 00000020 64 OBJECT GLOBAL DEFAULT 3-ШІ. 
11: 00000020 128 OBJECT GLOBAL DEFAULT СОМ str2 
12: 00000000 73 FUNC GLOBAL DEFAULT 1 main 
13: 00000000 0 NOTYPE GLOBAL DEFAULT UND memcpy 
14: 00000000 0 NOTYPE GLOBAL DEFAULT UND puts 











其 中 编号 为 11 的 符号 就 是 str2 的 声明 ， 其 类 型 为 COMM ， 其 大 小 为 128 字 节 。 











下 面 再 看 看 使 用 GNU ld 链接 上 述 文件 之 后 的 节 区 信息 。 





例 9-33 ”链接 之 后 ELF 目 标 文件 中 的 节 区 信息 





对 上 例 中 的 代码 进行 链接 ， 生 成 目标 文件 : 





[GCCQlocalhost asm]$ ld test.o -lc -o test 

ld: warning: cannot find entry symbol _start; defaulting to 0000000008048148 
[GCC@localhost asm]$ readelf -S test | 

There are 19 section headers, starting at offset 0x420: 

Section Headers: 





Nr] Name Type Addr off Size ES Flg Lk Inf Al 
0 NULL 00000000 000000 000000 00 о оо 
1] .іпёегр РКОСВІТЅ 080480Ғ4 0000Ғ4 000013 00 A 0 01 
21 .hash HASH 08048108 000108 000018 04 A 3 0 4 
3] .dynsym DYNSYM 08048120 000120 000030 10 А 4 1 4 
41 .dynstr STRTAB 08048150 000150 000021 00 A 0 01 
5] .gnu.version VERSYM 08048172 000172 000006 02 A 3 0 2 
61 .gnu.version г VERNEED 08048178 000178 000020 00 A 4 1 4 
7] .rel.plt REL 08048198 000198 000010 08 A 3 8 4 
8] -plt PROGBITS 080481а8 0001a8 000030 04 MX 0 0 4 
9] .text PROGBITS 08048148 000148 000049 00 АХ 0 0 4 
10] .rodata PROGBITS 08048221 000221 00001а 0 A 0 01 
111 .dynamic DYNAMIC 0804923с 00023c 0000а0 08 WA 4 0 4 
12] .got.plt PROGBITS 080492dc 0002dc 000014 04 ЖА 0 0 4 
13] .data PROGBITS 08049300 000300 000060 00 wA 0 032 
14] .bss NOBITS 08049360 000360 0000а0 00 МА 0 032 
15] .comment PROGBITS 00000000 000360 00002401 MS 0 0 1 
16] .shstrtab STRTAB 00000000 00038а 000092 00 0 0 1 
17] .symtab SYMTAB 00000000 000718 0001е0 10 18 19 4 
18] .strtab 5ТЕТАВ 00000000 0008f8 000075 00 0.01 





Кеу to Flags: 
W (write), A (alloc), X (execute), М (merge), 5 (strings) 
I (info), L (link order), G (group), x (unknown) 
O (extra OS processing required) o (OS specific), p (processor specific) 
















































































通过 比较 例 9-32 和 例 9-33 目 标 文件 的 节 区 信息 可 以 发 现 ， 由 于 链接 的 目标 文件 只 有 一 个 ， 并 且 使 用 的 是 动态 链接 ， 因 此 节 区 .text、.data 以 及 .rodata 的 大 小 均 无 变化 ， 其 存储 的 内 容 也 无 变化 。 而 .bss 
节 区 的 大 小 则 发 生 了 变化 ， 此 时 该 节 区 的 大 小 为 0xa0， 即 160 个 字 节 。 此 时 该 大 小 包括 了 原来 .bss 中 的 全 局 变量 j (占用 4 个 字 节 ) ， 还 包括 了 全 局 变量 str2 (占用 128 个 字 节 ) ， 由 于 str2 必 须 以 32 字 节 对 
此 ， 总 共 的 大 小 为 32+128=160 个 字 节 。 可 以 通过 readelf 工 具 进 一 步 看 到 : 





















































GCCQ@localhost asm]$ readelf -s test 
Symbol table '.dynsym' contains 3 entries: 


Num: Value Size Type Bind Vis Ndx Name 
0: 00000000 0 NOTYPE LOCAL DEFAULT UND 
1: 00000000 0 FUNC GLOBAL DEFAULT UND memcpy@GLIBC 2.0 (2) 
2: 00000000 0 FUNC GLOBAL DEFAULT UND puts@GLIBC 2.0 (2) 
Symbol table '.symtab' contains 30 entries: 
Мот Value Size Туре Bind Vis Ndx Мате 
0: 00000000 0 NOTYPE LOCAL DEFAULT UND 
1: 080480Ғ4 0 SECTION LOCAL DEFAULT 1. 
2: 08048108 0 SECTION LOCAL DEFAULT 2 
3: 08048120 0 SECTION LOCAL DEFAULT 3 
4: 08048150 0 SECTION LOCAL DEFAULT 4 
5: 08048172 0 SECTION LOCAL DEFAULT 5 
6: 08048178 0 SECTION LOCAL DEFAULT 6 
7: 08048198 0 SECTION LOCAL DEFAULT 7 
8: 080481a8 0 SECTION LOCAL DEFAULT 8 
9: 080481d8 0 SECTION LOCAL DEFAULT 9 
10: 08048221 0 SECTION LOCAL DEFAULT 10 
11: 0804923с 0 SECTION LOCAL DEFAULT 11 
12: 080492dc 0 SECTION LOCAL DEFAULT 12 
13: 08049300 0 SECTION LOCAL DEFAULT 13 
14: 08049360 0 SECTION LOCAL DEFAULT 14 
15: 00000000 0 SECTION LOCAL DEFAULT 15 
16: 00000000 0 FILE LOCAL DEFAULT ABS test.c 
17: 080492dc 0 OBJECT LOCAL DEFAULT 12 _GLOBAL OFFSET TABLE 
18: 0804923c 0 OBJECT LOCAL DEFAULT 11 DYNAMIC 
19: 08049320 64 OBJECT GLOBAL DEFAULT 13 вегі 
20: 00000000 0 NOTYPE GLOBAL DEFAULT UND start 
21: 00000000 0 FUNC GLOBAL DEFAULT UND memcpy@@GLIBC 2.0 
22: 08049300 4 OBJECT GLOBAL DEFAULT 13.1 = 
23: 08049360 0 NOTYPE GLOBAL DEFAULT ABS bss_start 
24: 08049380 128 OBJECT GLOBAL DEFAULT 14 Str2 
25: 08049360 4 OBJECT GLOBAL DEFAULT 14 j 
26: 08049400 0 NOTYPE GLOBAL DEFAULT ABS _end 
27: 00000000 0 FUNC GLOBAL DEFAULT UND puts@@GLIBC 2.0 
28: 08049360 0 NOTYPE GLOBAL DEFAULT ABS _edata Е 
29: 08048148 73 FUNC GLOBAL DEFAULT 9 main 























其 中 ，symtab 中 的 24 号 符号 str2 的 大 小 为 128 个 字 节 ， 所 关联 的 节 区 在 14 号 节 区 ， 即 .bss 节 区 。 


98 定义 输出 的 汇编 语言 
































在 GCC 由 RTL 生 成 机 器 汇编 语言 的 过 程 中 ， 不 同 目标 机 器 在 运行 不 同 操作 系统 时 所 支持 的 汇编 语言 的 格式 也 是 有 所 差异 的 ， 尤 其 是 各 种 环境 中 汇编 工具 对 于 汇编 文件 的 语法 要 求 ， 因 此 ， 需 要 针对 不 同 
的 机 器 以 及 不 同 的 操作 系统 运行 环境 ， 定 义 其 所 使 用 的 各 种 汇编 代码 生成 格式 ， 从 而 满足 目标 环境 对 汇编 代码 的 要 求 。 


















































99 ”机 器 描述 信息 的 提取 














GCC 使 用 机 器 描述 文件 (包括 $ftarget}.md，${target}.h，${target}.c 等 ) 描述 了 各 种 目标 机 器 的 特性 。 反 过 来 看 ， 如 果 给 定 某 个 特定 目标 机 器 的 机 器 描述 文件 ， 还 需要 解决 如 下 的 问题 

















(1) GCC 编译 系统 从 机 器 描述 文件 中 可 以 获取 到 什么 样 的 有 











(2) 这 些 信息 是 如 何 提取 出 来 的 ? 


(3) 这 些 信息 如 何 指导 编译 器 生成 目标 机 器 相关 的 代码 ? 











如 图 9-13 所 示 ，GCC 源 码 中 包含 了 一 些 名 称 为 gcc/gen* 的 文件 ， 这 些 文件 的 功能 就 是 读 取 、 解 析 机 器 描述 文件 ， 并 生成 与 目标 机 器 相关 的 源 代码 。 这 些 以 gen 开 头 的 文件 被 称 为 机 器 相关 的 生成 器 代码 
(Machine-Dependent Generator Code，MDGC) ， 其 编译 生成 的 可 执行 程序 就 用 来 从 目标 机 器 的 描述 文件 中 提取 信息 ， 并 生成 与 目标 系统 相关 的 源 代 码 。 例 如 图 9-13 中 的 gencodes.c 文 件 将 生成 可 执 
行程 序 gencodes，gencodes 程 序 则 扫描 机 器 描述 文件 ， 分 析 其 中 的 指令 模板 ， 并 生成 insn-codes.h 文 件 ， 描 述 目标 机 器 中 所 定义 的 指令 模板 索引 号 。 





























0 




















生成 的 目标 机 器 相关 源 代码 将 与 G6CC 的 其 他 源 代码 一 起 ， 编 译 生成 目标 机 器 上 的 编译 器 程序 。 生 成 的 代码 一 般 位 于 host-${host}y/gcc/ 目 录 下 ， 其 中 $fhost} 为 ./configure 时 指定 的 host 编 译 选项 的 值 。 











也 可 以 通过 shell 命 令 来 查看 这 些 文件 : 





[GCCQlocalhost gcc-4.4.0]$ ls gcc/gen* 

gcc/genattr.c gcc/genconstants.c gcc/gengtype-lex.l gcc/genpreds.c 
gcc/genattrtab.c gcc/genemit.c gcc/gengtype-parse.c gcc/gen-protos.c 
gcc/genautomata.c gcc/genextract.c дсс/дептадерв.с gcc/genrecog.c 


дсс/депсһеск.с gcc/genflags.c gcc/genmodes.c gcc/gensupport.c 


gcc/genchecksum.c gcc/gengenrtl.c gcc/genmultilib gcc/gensupport.h 
gcc/gencodes.c gcc/gengtype.c gcc/genopinit.c gcc/genconditions.c 
gcc/gengtype.h gcc/genoutput.c gcc/genconfig.c gcc/gengtype-lex.c 


gcc/genpeep.c 


机 器 描述 文件 


机 堪 相 关 的 生成 器 代码 


生成 的 目标 机 器 相关 代码 


GCC 程序 库 


print-rtll. с 


ggc-none. с 


9-13 ”概述 机 器 描述 信息 的 提取 


print-rtl. с 























在 GCC 编译 的 过 程 中 ， 通 过 指定 不 同 的 编译 目标 ， 即 -target 选 项 ，M DGC 就 会 选择 与 目标 机 器 $ftarget} 相 对 应 的 机 器 描述 文件 进行 信息 提取 ， 并 生成 一 列 与 目标 机 器 相关 的 源 代码 ， 这 些 代码 的 名 称 
以 insn- 开 头 ， 一 般 位 于 host-${hostMgcc 目 录 下 。 





[GCC@localhost асс-4.4.015 ls host-i686-pc-linux-gnu/gcc/insn-*. [ch] 
host-i686-pc-linux-gnu/gcc/insn-attr.h 
host-i686-pc-linux-gnu/gcc/insn-attrtab.c 
host-i686-pc-linux-gnu/gcc/insn-automata.c 
host-i686-pc-linux-gnu/gcc/insn-codes.h 
host-i686-pc-linux-gnu/gcc/insn-config.h 
host-i686-pc-linux-gnu/gcc/insn-constants.h 
host-i686-pc-linux-gnu/gcc/insn-emit.c 
host-i686-pc-linux-gnu/gcc/insn-extract.c 
host-i686-pc-linux-gnu/gcc/insn-flags.h 
host-i686-pc-linux-gnu/gcc/insn-modes.c 
host-i686-pc-linux-gnu/gcc/insn-modes.h 
host-i686-pc-linux-gnu/gcc/insn-opinit.c 
host-i686-pc-linux-gnu/gcc/insn-output.c 
host-i686-pc-linux-gnu/gcc/insn-peep.c 
host-i686-pc-linux-gnu/gcc/insn-preds.c 
host-i686-pc-linux-gnu/gcc/insn-recog.c 











为 了 说 明 这 些 机 器 信息 提取 的 细节 ， 下 面 给 出 一 个 具体 的 、 非 常 简单 的 机 器 dummy， 该 机 器 的 指令 如 表 9-13 所 示 ， 假 设 其 中 所 有 操作 数 的 类 型 均 为 整数 。 


表 9-13 dummy 机 器 的 指令 列表 


Ж © 功 
JIADDR] | 一 јАррк (йн) | 一 |PC<- [ADDR]( 间 接 跳 转 ) 
RETURN | 一 2-42-77 ова) 


其 机 器 描述 文件 dummy.md 文 件 的 主要 内 容 如 下 : 


шр 
єє 











[GCC@localhost paag-gcc]$ сас gcc/config/dummy/dummy.md 


;;Atrributes 


(define attr "type" 7 定义 属性 tyPe 
"other, mov,jump, add, return" ?7?type 的 取 值 
(const string "other")) 7?type 的 默认 值 


57 指令 模板 的 定义 
i; 0.MOVI 指 令 模板 : 对 应 于 MOVI 指 令 ， 完 成 立即 数 的 传送 

(define іпѕп "movi" 

(set (match operand:SI 0 "general орегапа" "") 
(match operand:SI 1 "immediate operand" ""))] 
"МОУІ %0, #%1" 

(вес attr "type 


mov")] 

) 

2: 1 .MOVSI 指 令 模板 : 对 应 于 MOV 指 令 

(define insn "movsi" 

(set (match operand:SI 0 "general орегапа" "") 
(match operand:SI 1 "general орегапа" ти 
"МОУ %0, %1" 

(set attr "type" "mov")] 

) 

j; 2.ADDISI3 指 令 模 板 ， 对 应 于 ADDI 指 令 

(define insn "addisi3" 

(вес (match operand:SI 0 "general орегапа" "") 

(ріпв:5І (match operand:SI 1 "general орегапа" "") 
(match орегапа:51 2 "immediate орегапа" "")))] 

"ADDI %0, %1, #%2" 

(set attr "type" "add")] 

) 

?; 3.ADDSI3 指 令 模 板 ， 对 应 于 ADD 指 令 

(define insn "addsi3" 

(вес (match operand:SI 0 "general орегапа" "") 

(Plus:SI (match operand:SI 1 "general орегапа" "") 
(match operand:SI 2 "general орегапа" "")))] 

"ADD %0, %1, %2" 

(set attr "type" "add")] 

) 

2: 4.JUMP 指 令 模板 ， 对 应 于 JUMP 指 令 ， 完 成 无 条 件 跳 转 

(define insn "jump" 

(вес (рс) (label ref (match operand 0 "" "")))] 

"JUMP %10" 

(set attr "type 


jump")] 
) 
i; 5.JUMP 指 令 模板 ， 对 应 于 J 指令 ， 完 成 间接 跳 转 

(define insn "indirect jump" 

(вес (рс) (match орегапа:51 0 "address орегапа" "р"))] 
"J Фа0" 

(set attr "type 


jump")] 
) 
i; 6.RETURN 指 令 模板 ， 对 应 于 RETURN 指 令 ， 完 成 函数 返回 
(define insn "return" 

(set (рс) (return))] 


"RETURN " 
(set attr "type" "return")] 
) 

777. 空 模板 

(define insn "dummy Pattern'" 
(reg:SI 0) ] 

"1" 


This is just empty !" 
(set attr "type" "other")] 


) 

ii 8.NOP 指 令 模板 ， 对 应 于 NOP 指 令 ， 完 成 空 操作 
(define insn "пор" 

(const int 0)1 





"пор" 
(вес attr "type" "other") ] 
) 
2: 自 定义 predicate test 
(define predicate "predicate test" 
(match operand 0 "register operand") 
{ 
unsigned int regno; 
regno = REGNO (op); 
return (regno -- 0); 











同时 定义 相应 的 dummy.c 和 dummy.h 文 件 ， 





由 于 篇 幅 ， 此 处 略 去 〈 可 以 参考 第 12 章 的 内 容 ) 。 





910 小 结 


本 章 主要 对 机 器 描述 文件 $ftarget}.[ch] 文 件 中 所 包含 的 内 容 进行 比较 详细 的 介绍 ， 然 而 这 两 个 文件 中 包含 的 内 容 太 多 ， 难 以 尽 述 ， 例 如 gcc/config/i386/i386.[ch] 两 个 文件 总 共有 32000 行 左右 的 代 
码 ， 其 中 包含 了 数 百 个 宏 定义 的 内 容 ， 如 果 只 从 代码 本 身 进行 分 析 ， 可 能 会 感觉 非常 混乱 。 在 分 析 这 几 个 文件 时 ， 需 要 尽量 多 做 实验 ， 通 过 结果 来 分 析 这 些 宏 定义 描述 的 本 质问 题 。 



































因 











机 器 描述 文件 $ftarget}.[ch] 涉 及 
相关 实现 的 细节 。 


体 的 机 器 特性 包括 目标 处 理 器 中 寄存 器 、 存 储 布局 、 寻 址 方式 等 核心 问题 ， 








此 ， 在 分 析 本 章 内 容 时 ， 也 可 以 查阅 特定 机 器 的 硬件 手册 ， 从 而 理解 各 种 不 同 目标 机 器 











另外 ， 本 章 的 内 容 也 涉及 各 种 软件 开发 环境 和 运行 环境 ， 尤 其 是 编译 、 汇 编 以 及 链接 等 工具 链 、 目 标 文件 格式 等 ， 以 GNU 开 发 链 为 例 ， 可 以 更 多 地 参阅 GNU аз, GNU ld 以 及 ELF 文 档 格式 等 相关 文 
档 。 


第 10 章 从 GIMPLE 到 RTL 





GIMPLE 是 一 种 与 前 端 编程 语言 和 后 端 目标 机 器 无 关 的 中 间 表 示 形 式 ， 为 了 实现 对 多 种 目标 机 器 的 支 
9 章 介 绍 了 机 器 描述 中 的 $target}.[ch] 文 件 ， 这 些 内 容 都 将 在 GIMPLE 转 换 成 机 器 相关 的 RTL 时 需要 被 使 
RTL 的 转换 ， 即 从 GIMPLE 转 化 成 insn 序 列 的 过 程 。 


竺 ，GCC 引 入 了 RTL。 第 7 章 对 RTL 进 行 了 详细 的 描述 ， 第 8 章 介绍 了 机 器 描述 ${target}.md 文 件 ,第 
。 这 里 需要 明确 的 是 ， 在 这 里 提 到 的 GIMPLE 到 RTL 的 转换 ， 确 切 地 讲 ， 应 该 是 指 从 GIMPLE 到 IR- 























回忆 7.9 节 中 的 内 容 ， 表 示 insn 的 RTX 包含 下 列 6 种 RTX 表达 式 : 


DEF ЕТІ, ЕХРЕ(ІМ5М, "insn", "iuuBieie", RTX_INSN) 


DEF АТ EXPR(JUMP INSN, "jump insn", "ішіВіеіей", RTX INSN) 
DEF RTL EXPR(CALL INSN, "call insn", "iuuBieiee", RTX INSN) 
DEF ЕТІ, EXPR (BARRIER, "barrier", "iuu00000", RTX EXTRA) 

DEF RTL EXPR (CODE _ LABEL, "code label", "iuuBO0is™, RTX EXTRA) 
DEF RTL EXPR (NOTE, "note", "iuuBOni", АТХ EXTRA) Е 


10.1 GIMPLE 序 列 








在 GIMPLE 序 列 生成 之 后 ，GCC 在 GIMPLE 中 间 格 式 上 进行 了 各 种 各 样 的 与 目标 机 器 无 关 的 处 理 和 优化 ， 这 些 处 理 被 组 织 成 一 系列 的 处 理 过 程 (Pass) ,其 中 针对 GIMPLE 的 最 后 一 个 关键 处 理 过 程 为 
pass_expand， 该 Pass 就 完成 了 GIMPLE 向 RTL 的 转换 ， 即 由 GIMPLE 中 间 结 果 生 成 RTL 形 式 的 insn。 从 GIMPLE 向 RTL 的 转换 过 程 是 一 个 从 机 器 无 关 信 息 向 机 器 相关 信息 的 转换 。 首 先 ， 通 过 一 个 例子 来 说 明 
在 GIMPLE 进 行 RTL 生 成 之 前 ，GIMPLE 序 列 的 具体 形式 。 








对 于 如 下 的 源 代码 : 





[GCC@localhost test]$ сас test.c 
int main(int argc, char *argv[]){ 
int i=0; 
int sum=0; 

for (i=0; 1<10; i++){ 

sum = Sum + i; 

} 

return sum; 


i 





在 GIMPLE 处 理 结束 且 即 将 转换 成 RTL 之 前 ， 当 前 函数 的 GIMPLE 语 句 被 分 配 到 一 个 个 的 基本 块 中 ， 每 个 基本 块 中 包含 若干 条 GIMPLE 语 句 。 





如 果 需 要 查看 在 RTL 生 成 之 前 的 GIMPLE 语 句 ， 可 以 针对 当前 函数 的 所 有 基本 块 ， 分 别 打印 其 所 包含 的 GIMPLE 语 句 。 可 以 在 GCC 的 源 代码 中 增加 如 下 的 代码 ， 用 来 将 RTL 生 成 之 前 的 GIMPLE 语 句 序列 
保存 到 文件 gimple-before-expand 中 。 





FILE *fp; 

fp = fopen("gimple-before-expand", "w"); 

FOR BB BETWEEN (bb, ENTRY BLOCK PTR ->пехе bb, EXIT BLOCK РТВ, next ЬЫ) 
gimple dump bb (bb, fp, 0, Oxffff); 








хч 


查看 该 GIMPLE 序 列 文件 的 内 容 : 





[СССё1оса1һоѕі test]$ сас gimple-before-expand 
% BLOCK 2 
# PRED: 6 
<&0xb7508528> [test.c : 2] gimple assign <integer cst, 1р.1192, 0, NULL> 
<80х57508564> [test.c : 3] gimple assign <integer cst, sumD.1193, 0, NULL> 
<&0xb75085a0> [test.c : 41 gimple assign <integer сз, 1р.1192, 0, NULL> 
[test.c : 4] goto <bb 4>; 
# SUCC: 4 
# BLOCK 3 
# PRED: 4 
<&0xb758a240> [test.c : 5] gimple assign <plus expr, sumD.1193, sumD.1193, iD.1192> 
<80х0758а280> [test.c : Чішріе assign <plus expr, iD.1192, iD.1192, 1> 
# SUCC: 4 Е 
# BLOCK 4 
# PRED: 2 3 
<&0xb758c7e0> [test.c : 4] дішріе сопа <1е expr, iD.1192, 9, NULL, NULL> 
goto <bb 3>; Е Е 
е1ѕе 
собо <bb 5>; 
# 50СС: 35 
# BLOCK 5, starting at line 0 
# PRED: 4 
<80х075085ас> [test.c : 7] дішріе assign <уаг десі, 0.1197, ѕштр.1193, NULL> 
<80х5758с818> gimple return <р.1197> Е 
# SUCC: ЕХІТ ін 


а 
ф- 








102 ”典型 数据 结构 





在 以 函数 为 单位 进行 RTL 生 成 时 ， 需 要 对 当前 函数 的 RTL 信 息 进 行 维护 ， 这 个 主要 由 结构 体 struct rtl_data 来 描述 ，struct rtl_data 在 gcc/function.h 中 定义 ， 该 结构 的 内 容 众多 ， 在 此 略 去 ， 其 主要 字段 
的 意义 在 后 续 的 RTL 生 成 中 有 所 涉及 ， 可 以 使 用 如 下 的 宏 定义 对 其 中 的 一 些 字段 进行 访问 。 





























#define return label (crtl->x return label) 

#define naked return label (crtl->x naked return label) 

#define stack slot list (сгі1->х stack slot list) 

#define parm birth іпѕп (crtl->x parm birth insn) 

#define frame offset (crtl->x frame offset) 

#define stack check probe note (crtl->x stack check probe note) 

#define arg pointer save area (crtl->x arg pointer save area) 

#define used temp slots (crtl->x used temp slots) 

#define avail temp slots (crtl->x avail temp slots) 

#define temp slot Теуеі (crtl->x temp slot 1еуе1) 

#define nonlocal goto handler labels (crtl->x nonlocal goto handler labels) 
#define frame pointer needed {crtl->frame pointer needed) | 
#define stack realign fp (crtl->stack realign пеедеа && !crtl->need агар) 
#define stack realign дгар (crtl->stack realign needed && crtl->need дгар) 














另外 ， 在 gcc/emit-rtl.c 中 定义 了 如 下 的 宏 ， 用 来 访问 当前 函数 正在 处 理 的 insn 序 列 。 











#define first insn (crtl->emit.x first insn) 
#define last insn (crtl->emit.x last insn) 
#define сог insn uid (crtl->emit.x сог insn uid) 





10.3 ”RTL 生 成 的 基本 过 程 





RTL 的 内 部 表示 是 从 GIMPLE 形 式 转化 而 来 的 ， 是 程序 代码 另外 一 种 规范 的 中 间 表 示 ， 记 为 IR-RTL， 目 标 机 器 对 应 的 汇编 代码 就 是 在 IR-RTL 基 础 上 生成 的 。 在 7.9 节 已 经 看 到 ， 程 序 代码 的 RTL 中 间 表 示 就 


是 双向 链表 所 链接 的 insn 链 表 ， 包括 了 insn、jump_insn、call_insn、barrier、code label 以 及 note 六 种 RTX 表示 形式 。 因 


应 的 insn 序 列 的 过 程 。 





此 ，RTL 的 生成 可 以 看 作 是 以 函数 为 单位 ， 将 该 函数 对 应 的 GIM PLE 序 列 转换 成 相 


















































作为 GIMPLE 处 理 中 的 最 后 关键 过 程 (Pass) ，struct гі орї раѕѕ pass_expand 完 成 了 GIMPLE 到 RTL 的 转换 ， 具 体 来 说 ， 该 Pass 的 声明 如 下 ， 其 处 理 的 入 口 函数 为 gcc/cfgexpand.c 中 的 
дітріе expand_cfg 函 数 。 
struct rtl оре pass pass expand = 
{ 
{ 
ЕТІ. РА55, 
"expand", /* Pass 名 称 */ 
NULL, /* Pass 条 件 */ 
gimple expand cfg, /* Pass 执 行 的 函数 */ 
NULL, /* 子 Pass 指 针 */ 
NULL, /% Pass 链 中 的 下 一 个 Pass */ 
0, /% Pass 编 号 %/ 
TV_EXPAND, /ж 记 时 标记 */ 
PROP gimple leh | PROP cfg, /* 要 求 的 属性 10 
PROP rtl, /ж 提供 的 属性 
PROP trees, /* 破 会 的 属性 
0, /* анық Қамын. +y 
TODO dump func, /% Pass 结 束 后 执行 动作 标记 */ 
} 
1; 
执行 该 Pass 时 ， 函 数 调用 堆栈 通常 如 下 所 示 : 
(дар) Бе 
#0 дішріе expand cfg () ас http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/16037/0EBPS/Text/ . ./http://www.hzcourse .com/resource/readBook 
#1 0x082933f8 in execute опе pass (pass=0x898de60) at http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/16037/0EBPS/Text/../http://www.hzc 
#2 0х082935Ғ8 in execute pass list (pass=0x898de60) at http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/16037/0EBPS/Text/ . ./http://www.hz 


0x083a70dc in 
at http://www. 


#4 0х0851048Ғ in 

at http://www. 
#5 0x085108a0 in 
#6 0x08510b9b in 
#7 0х0805есас in 
#8 0х083586а5 in 
#9 0x0835alaf in 
#10 0x0835a211 in 
#11 0х080с41ае in 


at http://www. 


tree rest of compilation (fndecl=0xb7c82900) 

hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/16037/0EBPS/Text/../http://www.hzcourse.com/resource/readBook?path=/openresources/ 
cgraph expand function (node=0xb7c82980) 

hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/16037/0EBPS/Text/../http://www.hzcourse.com/resource/readBook?path=/openresources/ 
cgraph output іп order () at http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/16037/0EBPS/Text/../http://www.hzcourse.cc 
cgraph optimize () at http://www.hzcourse.com/resource/readBook?path=/openresources/teach _ebook/uncompressed/16037/0EBPS/Text/ . ./http://www.hzcourse.com/resot 
с write global declarations () at http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/16037/0EBPS/Text/ . ./http://www.hzcour 
compile file () at http://www.hzcourse.com/resource/readBook?path=/openresources/teach_ebook/uncompressed/16037/0EBPS/Text/ . ./http: //www.hzcourse .com/resource 
ао compile () at http://www.hzcourse.com/resource/readBook?path=/openresources/teach_ebook/uncompressed/16037/0EBPS/Text/ . . /http://www.hzcourse.com/resource/r 
toplev_main (argc=2, argv=0xbfc6c494) at http://www.hzcourse.com/resource/readBook?path=/openresources/teach_ebook/uncompressed/16037/0EBPS/Text/ . ./http: //www 
main (argc=Cannot access memory at address 0х4сс) 
hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/16037/0EBPS/Text/../http://www.hzcourse.com/resource/readBook?path=/openresources/ 





在 GCC 中 ，GIMPLE 到 RTL 的 转换 是 以 函数 为 单位 进行 ， 每 当 GCC 


针对 该 函数 的 GIMPLE 中 


语 ; 


分 析 完 一 个 函数 后 ， 就 已 经 构建 起 了 该 函数 的 AST 
间 表 示 进 行 各 种 优化 处 理 ， 最 后 ， 再 执行 pass_expand 将 每 个 函数 的 GIMPLE 序 列 转换 成 RTL 序 列 。 


然后 对 该 AsT 进 行规 范 化 (Genericize) 并 转换 成 GIMPLE 语 句 。 此 后 ，GCC 


дітріе expand_cfg 函 数 的 主要 框架 如 下 : 





static unsigned іп 
gimple expand cfg 
{ 


basic block bb, 
sbitmap blocks; 


edge iterator ei; 


edge е; 


с 
(void) 


init_block; 


/* 设置 正在 展开 GIMPLE 的 标志 */ 
currently expanding to rtl = 


гі] profile Жос 
insn locator: 
/* 设置 insn 对 应 


Т. 





文件 的 位 置信 息 


bb (ENTRY 1 Ес РТВ); 
1ос (); 
%/ 


if (!DECL BUILT ІМ (current function дес1)) 

{ 
if (cfun->function start locus == UNKNOWN LOCATION) 
set_curr іпѕп source . location (БЕСІ: SOURCE ‚ LOCATION (current function дес1)); 
else 


set согг іп 


} 
/* 设置 insn 对 应 的 块 信 ， 


веб curr insn bl 
prologue locator 


sn_source location (cfun->function start locus); 





е */ 
(DECL_INITIAL (current function дес1)); 
curr insn locator (); 


оск 


/* 保证 函数 生成 的 第 一 个 insn 为 NOTE insn %/ 


emit note (NOTE . 


INSN_DELETED) ; 


discover nonconstant : . array refs (); 


/* 设置 堆栈 对 齐 信息 */ 


targetm.expand ti 
crtl->stack а114 
crtl->max used s 
crtl->stack alig 
crtl->preferred : 
cfun->cfg->max_j 
/* 变量 展开 */ 


expand Used vars 


o_rtl_hook (); 

nment needed = STACK . BOUNDARY; 

tack slot alignment = STACK_BOUNDARY; 
nment estimated = STACK < BOUNDARY; 
stack boundary = STACK BOUNDARY; 
umptable ents = 0; 


0; 


/* 省 略 一 些 代码 */ 
/* 函数 参数 及 返回 值 的 处 理 */ 


expand function 


start (current_function десі); 


/* җи F] 


/* 创建 初始 块 */ 
init block = con: 
FOR ЕАСН EDGE (е 


/* 初始 化 基本 块 及 标签 的 映射 表 ， 用 


lab rtx for bb = 


struct іпіс block 7 
, еі, ENTRY BLOCK PTR->succs) e->flags &= ~EDGE EXECUTABLE; 
用 来 描 还 每 个 基本 块 的 开始 标签 rtx 与 基本 块 之 间 的 对 应 关系 */ 


pointer map create (); 


/* 对 每 个 基本 块 ， 逐 一 进行 RTT 生 成 */ 


FOR BB BETWEEN ( 
bb = - ехрапа < gi 


bb, init_block->next_bb, EXIT_BLOCK_PTR, next_bb) 
mple basic block (bb); 


/* 释放 描述 标签 rtx 与 基本 块 对 应 关系 的 映射 表 */ 


pointer map dest 
free histograms 
/* 创建 退出 块 */ 
construct exit р 
вес сиг insn bl 
insn locators fi 


roy (lab rtx for bb); 
0; 


lock (); 
ock (РЕСІ INITIAL 
nalize (); 


(current function дес1)); 


/* 设置 RTL 生 成 结束 的 标志 */ 


currently ехрапді 


ing to_rtl = 


/* 省 略 一 址 其 他 处 理 * 


/* Жж 


return 0; 








从 该 函数 的 主要 内 容 可 以 看 出 ， 


每 个 函数 代码 从 GIMPLE 形 式 转换 到 RTL 的 过 程 主要 包括 如 下 几 个 步 又: 

















(1) 变量 展开 : 调 


ехрапа иѕеа vars (void) 函数 ， 对 当前 函数 中 所 有 的 变量 进行 分 析 ， 在 虚拟 寄存 器 或 者 堆栈 中 为 其 分 配 空间 ， 并 生成 对 应 的 RTX。 








(2) 参数 和 返 


(3) 初始 块 的 处 理 : 


(4) 基本 块 的 展开 : 


回 值 的 

















处 理 : 调 








expand function_start (current function_decl) 函数 ， 对 函数 的 参数 和 返回 值 进行 处 理 ， 生 成 其 对 应 的 RTX。 














调 





construct_init block (void) 函数 ， 创 建 初始 块 ， 并 修正 函数 的 控制 流 | 


图 





CFG, 








个 进行 











对 函数 体 中 每 个 基本 块 所 包含 的 GIMPLE 语 句 序列 逐 





展开 ， 这 是 RTL 生 成 的 





部 分 ， 





采用 的 形式 为 : 








FOR ВВ BETWEEN (БЫ, init block->next bb, ЕХІТ BLOCK PTR, next ЬЫ) 
bb = expand gimple basic block (bb); 








即 对 函数 初始 块 之 后 的 每 个 基本 块 逐一 进行 展开 。 











(5) 退出 块 的 处 理 : 调用 construct_exit_block (void) 函数 ， 创 建 退出 块 ， 生 成 函数 退出 时 的 RTL， 并 修正 函数 的 控制 流 | 


网 











СЕС, 











(6) 其 他 处 理 。 





从 下 一 节 开始 ， 将 对 GIMPLE 到 RTL 的 转换 过 程 进行 仔细 的 分 析 ， 并 通过 大 量 的 实例 说 明 GIM PLE 的 展开 过 程 。 


104 ”GIMPLE 语 句 转 换 成 RTL 








10.3 节 对 GIMPLE 到 RTL 的 生成 从 函数 的 角度 进行 了 介绍 ， 包 括 了 变量 、 参 数 、 返 回 值 以 及 基本 块 的 处 理 等 ， 然 而 对 于 每 一 条 GIMPLE 语 句 的 RTL 生 成 过 程 并 没有 详细 分 析 ， 只 是 简单 地 给 出 了 生成 的 
insn 序 列 。 本 节 通 过 几 个 实例 说 明 一 条 GIMPLE 语 句 如 何 生成 一 条 或 者 多 条 insn 的 具体 实现 过 程 。 一 般 来 讲 ， 一 条 GIMPLE 语 句 生 成 RTL 时 ， 通 常 先 将 该 GIMPLE 语 句 转换 成 树 的 存储 形式 ， 再 根据 树 中 表达 
式 节点 的 TREE_CODE 值 ， 调 用 相应 的 函数 生成 对 应 的 insn 表 示 。 
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105 ДМ 


本 章 主要 介绍 了 RTL 的 生成 过 程 。 

















RTL 的 生成 以 函数 为 单位 ， 分 别 进行 变量 rtx 生 成 、 参 数 处 理 、 基 本 块 处 理 等 关键 过 程 。 基 本 块 中 每 条 GIMPLE 语 句 的 转换 则 主要 根据 其 转换 成 树 结构 的 TREE_CODE 选 择 相应 的 展开 函数 ， 并 最 终 根据 
TREE CODE 及 机 器 模式 等 关键 信息 ， 查 找 optab 中 对 应 的 表 项 ， 获 取 构 造 insn 的 指令 模板 索引 号 ， 从 而 使 用 该 模板 中 的 构造 函数 完成 insn 的 构造 。 








从 GIMPLE 到 RTL 的 过 程 非常 复杂 ， 而 且 针对 不 同 树 节 点 有 数目 众多 的 展开 函数 ， 不 能 一 一 介绍 ， 本 章 介绍 的 GIMPLE GOTO 及 GIMPLE_AssIGN 语 句 的 转换 只 能 是 抛砖引玉 罢了 ， 有 兴趣 的 读者 可 以 进 
一 步 深入 分 析 。 


第 11 章 ”RTL 处 理 及 优化 


在 all_passes 链 中 ,执行 了 pass_expand 过 程 之 后 ，GCC 的 中 间 表 示 就 已 经 转换 成 RTL 形 式 ， 此 后 的 所 有 处 理 都 是 基于 RTL 的 处 理 过 程 ， 即 RTL_PASS。 所 有 的 RTL 处 理 都 包含 在 
pass_rest_of_compilation 的 处 理 过 程 及 其 子 过 程 中 ， 主 要 包括 了 对 pass_expand 所 生成 的 insn 序 列 进行 进一步 的 处 理 ， 包 括 循 环 优化 、 指 令 调 度 、 寄 存 器 分 配 、 帘 孔 优化 等 过 程 ， 并 最 终 根据 RTL 生 成 目标 
机 器 上 的 汇编 代码 。 















































由 于 RTL 的 处 理 非常 复杂 ， 涉 及 的 处 理 过 程 也 有 将 近 100 个 ， 每 个 处 理 过 程 都 涉及 一 些 非常 复杂 的 算法 ， 很 难 一 一 详尽 说 明 。 因 此 ， 本 章 主要 介绍 RTL 处 理 的 几 个 关键 过 程 ， 重 点 关注 其 处 理 功 能 和 对 
RTL 处 理 的 阶段 结果 ， 有 兴趣 的 读者 可 以 根据 自身 的 实际 情况 对 处 理 过 程 中 的 各 种 算法 进行 详细 分 析 。 




















其 他 RTL 处 理 及 优化 的 文档 ， 可 以 参阅 gccinternal。 


11.1 “RTL 处理 过 程 




















在 gcc/passes.c 文 件 中 ， 可 以 通过 增加 调试 语句 ， 输 出 各 种 处 理 过 程 的 基本 信息 ， 其 中 基于 RTL 中 间 表 示 进 行 的 处 理 过 程 主要 包括 如 下 的 Pass， 其 中 一 些 主 要 过 程 给 出 了 注释 说 明 。 





NEXT PASS (раѕѕ геѕі of compilation); 
{ 


struct оре раѕѕ **p = &pass rest of compilation.pass.sub; 
NEXT PASS (pass init function); 
МЕХТ РА55 (pass jump); /* 主要 删除 不 可 到 达 的 基本 块 */ 
NEXT PASS (pass rtl eh); /* 异常 处 理 */ 
NEXT PASS (pass initial value sets); 
NEXT PASS (pass unshare а11 rt1) 7 
NEXT_PASS (pass instantiate virtual regs); /* 实例 化 一 些 特殊 的 虚拟 寄存 器 */ 
МЕХТ _ PASS 
МЕХТ PASS 
NEXT PASS 
NEXT _ PASS 
NEXT PASS 
NEXT _ PASS 
NEXT PASS 
NEXT _ PASS 
NEXT PASS 
{ 

struct opt pass **р = &pass_loop2.pass.sub; 

NEXT_PASS (pass_rtl_loop_init); 

NEXT РА55 (pass_rtl_move_loop_invariants) ; /* 常量 外 移 */ 

NEXT PASS (pass_rt1l_unswItch)7 

МЕХТ PASS (раѕѕ rtl unroll апа peel loops); 

( 
( 


( 

( 

( Е 
(pass іпіо cfg layout mode) 7 
(pass jump2) 7 | Е 
(pass_lower subreg) Н 

(pass df initialize орі); 
(pass cse); т 

( 
( 
( 
( 


равв rtl ifcvt) 7 


разв 100р2); /* 循环 优化 */ 


NEXT_PASS (pass гі] doloop); 
NEXT РА55 (pass гі1 loop done); 
*p = NULL; 2 

} 
МЕХТ РА55 
МЕХТ PASS 
МЕХТ РА55 


(pass web); 

(pass_jump_ bypass); 

(раѕѕ сѕе2); 

МЕХТ PASS (pass гі] dsel); 

NEXT РА55 (pass гі1 fwprop addr); 

МЕХТ PASS (pass reginfo іпіс); 

NEXT PASS (pass іпс дес); 

NEXT PASS (pass initialize regs); 
NEXT_PASS (pass outof cfg Tayout mode); 
МЕХТ РА55 (pass ud гіі асе); 


МЕХТ РА55 
МЕХТ РА55 
МЕХТ РА55 
МЕХТ РА55 
МЕХТ РА55 
МЕХТ РА55 


(pass_combine); 
(pass if after - combine); 
(pass partition 1 blocks); 
(pass regmove); 
(pass_split all insns); 
(раѕѕ lower © subreg2); ; 
МЕХТ PASS (pass ағ initialize по _ ор); 
МЕХТ_РА55 (pass stack ptr 1 тоа); 
МЕХТ РА55 (pass поде вміссһіпа); 

( 

( 

( 

( 

( 

( 

( 

( 


NEXT PASS (pass ѕее); 
МЕХТ РА55 pass_match авт constraints); 
NEXT_PASS ); 
МЕХТ РА55 sched); /* 指令 调度 */ 
NEXT_PASS (pass subregs of mode init); 
NEXT PASS (pass ira); /* IRA: Integrated Register Allocation 统一 寄存 器 分 配 */ 
NEXT_PASS (pass subregs of mode finish); 
МЕХТ РА55 pass postreload); 
{ 
struct opt pass **p = &pass postreload.pass.sub; 
МЕХТ РА55 (pass postreload cse); 
МЕХТ РА55 (pass_gcse2); 
МЕХТ PASS (pass_split after ге1оаа); 
NEXT_PASS (pass branch target load optimizel); 
NEXT_PASS 
МЕХТ РА55 
МЕХТ РА55 
МЕХТ РА55 


" 
@ 
т 
а 
т 
3 
2 


раѕѕ 


( 
( 
( 
(раѕѕ thread prologue i and | epilogue) ; 
(pass_rtl_dse2); 
(pass 1 rtl: _ѕедарѕёг); 
(pass : Stack adjustments) ; 
NEXT_PASS (pass реерһо1е2); 
NEXT PASS (pass if after reload); 
NEXT PASS (pass regrename); ; 
( 
( 
( 
( 
( 
( 
( 
( 


МЕХТ PASS (раѕѕ сргор hardreg); 
МЕХТ PASS (pass fast Ytl асе); 
МЕХТ PASS (раѕѕ : ,reorder - Біоскв); 
МЕХТ PASS (pass branch target load optimize2); 
NEXT PASS (pass leaf regs); 
NEXT_PASS 
МЕХТ РА55 
МЕХТ РА55 
1 
struct оре раѕѕ **р = &єраѕѕ ѕбаск regs.pass.sub; 
NEXT PASS (pass_split реѓоге regstack); 
МЕХТ РА55 (pass_stack гедв гоп) ; 


pass эсһеа2); 7/% 指令 调度 2 */ 
pass_stack гедѕ); 


pass_split 1 before_ sched2); 


} 
МЕХТ РА55 
МЕХТ РА55 
МЕХТ РА55 
МЕХТ РА55 


(pass_compute alignments); 
(pass_duplicate computed gotos); 
(pass_variable 1 tracking); ; 
(pass free сҒа); 

NEXT_PASS (pass machine reorg); 

МЕХТ PASS (pass cleanup barriers); 

МЕХТ РА55 (pass delay slots); 
( 
( 
( 
( 
( 


МЕХТ PASS (pass split for shorten branches); 
МЕХТ PASS (раѕѕ convert to eh | region ranges); 
NEXT PASS pass_shorten 1 branches); 

NEXT PASS (pass set nothrow function flags); 
МЕХТ РА55 (pass final); Т/х 汇编 代码 生成 */ 


} 
NEXT PASS (pass df finish); 
} 





下 面 的 章节 将 对 指定 调度 、 寄 存 器 分 配 以 及 汇编 代码 生成 等 处 理 过 程 进 行 详细 分 析 。 


112 ”特殊 虚拟 寄存 器 的 实例 化 














在 第 10 章 中 介绍 的 RTL 生 成 过 程 中 ， 表 示 函 数 参 数 、 变 量 的 RTX 表示 中 均 使 用 了 一 些 特殊 的 虚拟 寄存 器 ， 例 如 virtual_incoming_args、virtual_stack_vars、virtual_stack_dynamic 以 及 
virtual_outgoing_args 等 ， 这 些 虚拟 寄存 器 是 访问 函数 传 入 参数 、 局 部 变量 、 堆 栈 中 动态 分 配 空间 以 及 传 出 参数 的 基地 址 ， 具 有 非常 重要 的 意义 ， 见 表 11-1。 然 而 ， 最 终生 成 代码 时 ， 这 些 虚拟 的 寄存 器 需 
要 实例 化 成 目标 机 器 上 特定 的 物理 寄存 器 (硬件 寄存 器 ) ， 这 正 是 RTL 处 理 过 程 pass_instantiate_virtual_regs 的 主要 作用 。 






























































表 11-1 insn 中 的 特殊 虚拟 寄存 器 及 其 意义 


insn 中 的 虚拟 寄存 器 名 称 作 M 
virtual_stack vars 自动 变量 的 基地 址 
virtual_stack_dynamic 堆栈 栈 顶 的 地 址 


раѕѕ іпѕїапіаїе virtual_regs 过 程 的 主要 功能 在 instantiate _virtual_regs 函 数 中 完成 ， 该 函数 对 insn 链 表 中 的 insn 逐 一 进行 如 下 的 处 理 : 








(1) 如 果 insn 的 主体 ， 即 PATTERN (insn) 中 的 RTX_CODE 为 USE、CLOBBER、ADDR VEC、ADDR_DIFF VEC、ASsM_INPUT 时 不 予 处 理 ， 因 为 这 些 RTL 中 不 会 出 现 上 述 的 虚拟 寄存 器 。 











(2) 调用 函数 instantiate_virtual_regs іп іпѕп (insn) 及 instantiate_ virtual_regs_in_rtl| (insn) 等 对 insn 中 所 包含 的 特殊 虚拟 寄存 器 进行 实例 化 ， 该 函数 同时 会 调用 extract_insn (insn) 对 该 insn 
进行 识别 ， 并 设置 其 insn_code， 即 与 该 insn 主 体 部 分 匹配 的 指令 模板 的 索引 号 。 











(3) 其 他 特殊 处 理 。 





下 面 给 出 一 个 例子 ， 说 明 该 处 理 过 程 前 后 insn 序 列 的 变化 情况 ， 从 而 说 明 该 处 理 过 程 的 主要 功能 。 


例 11-1 pass instantiate virtual_regs 对 insn 的 变换 








本 例 使 用 gimple2rtl.c 作 为 源 代码 ， 在 i386 机 器 上 运行 如 下 的 编译 命令 











[GCC@localhost g2r]$ ~/paag-gcc/host-i686-pc-linux-gnu/gcc/ccl gimple2rtl.c -fdump-rtl-all 











在 生成 的 文件 中 包含 了 gimple2rtl.c.132r.unshare 和 gimple2rtl.c.133r.vregs 两 个 文件 ,分别 是 执行 上 述 虚 拟 寄存 器 实例 化 之 前 和 之 后 的 insn 序 列 。 下 面 节选 出 其 中 开始 的 两 条 insn 进 行 对 分 析 。 














[GCC@localhost g2r]$ cat gimple2rtl.c.132r.unshare 
;; Function gimple2rtl (gimple2rt1) 

(note 1 0 5 NOTE_INSN_DELETED) 

(note 5 1 2 2 [bb 2] NOTE INSN BASIC BLOCK) 

(insn 2 5 3 2 gimple2rtl.c:4 (set (reg:SI 68) 


(тет/с/і:5І (Plus:SI (reg/f:SI 53 virtual-incoming-args) (const іпе 4 [0х4])) [0 b+0 54 А32])) -1 (nil)) 

(іпвп 3 2 4 2 gimple2rtl.c:4 (set (mem/c/i:HI (Plus:SI (reg/f:SI 54 Virtual-stack-vars) 
(const іп -20 [0xffffffec])) [0 b+0 52 А16]) (subreg:HI (reg:SI 68) 0)) -1 (nil)) 

[GCC@localhost g2r]$ cat gimple2rt1.c.133r.Vregs 
;; Function gimple2rtl (gimple2rt1l) 
(note 1 0 5 NOTE ІМ5М DELETED) 
(note 5 1 2 2 [bb 2] КОТЕ INSN BASIC BLOCK) 
(insn 2 5 3 2 gimple2rtl.c:4 (set (reg:SI 68) 


(mem/c/i:SI (plus:SI (reg/f:SI 16 argp) (const_int 4 [0x4])) [0 b+0 54 A32])) 41 {*movsi_1} (nil)) 
(insn 3 2 4 2 gimple2rtl.c:4 (set (mem/c/i:HI (plus:SI (reg/f:SI 20 frame) 
(const_int -20 [0xffffffec])) [0 b+0 52 A16]) (subreg:HI (reg:SI 68) 0)) 44 {*movhi_1} (nil)) 





首先 分 析 上 述 两 个 文件 输出 中 编号 为 2 的 insn。 在 pass_instantiate_ virtual_regs 处 理 过 程 执行 的 前 后 ， 这 条 insn 的 变化 如 下 : 





执行 Pass_instantiate Virtual regs 前 : 
(insn 2 5 3 2 gimple2rtl.c:4 (set (reg:SI 68) 

(mem/c/i:SI (Plus:SI (reg/f:SI 53 virtual-incoming-args) (const int 4 [0x4])) [0 b+0 54 A32])) -1 (nil)) 执 行 pPass_instantiate уігіџа1 regs 后 : 
(insn 2 5 3 2 gimple2rtl.c:4 (set (reg:SI 68) 

(mem/c/i:SI (plus:SI (reg/f:SI 16 агор) (const int 4 [0х4])) [0 b+0 54 A32])) 41 {*movsi 1) (nil)) 





其 中 的 变化 主要 包括 两 个 方面 : 








(1) 虚拟 寄存 器 (reg/f: SI 53 virtual-incoming-args) 被 实例 化 为 物理 寄存 器 (reg/f: 51 16 агдр) ， 即 argp 寄 存 器 。 


(2) insn 中 倒数 第 二 个 操作 数 从 -1 变 成 了 人 movsi_1}， 表 示 insn_code=CODE_FOR_movsi_1。 即 通过 extract_insn 函 数 ， 完 成 了 该 insn 与 指令 模板 的 匹配 ， 从 而 确定 了 该 条 指令 对 应 的 insn_code 为 
41。 





从 gcc/config/i386/i386.md 中 可 以 看 到 如 下 的 指令 模板 : 


(define insn "*movsi 1" 


[(set (match_operand: SI 0 "nonimmediate орегапа" "=r,m ,*y,*y,?rm,?*y,*x,*x,?r (т ,?*Yi,*x") 
(match operand:SI 1 "general орегапа" 
"g ,гі,С ,%у,“у ‚тш ‚С ,*x,*Yi,*x,r ут "))] 
"! (MEM Р (operands[0]) && МЕМ Р (operands[1]))" 
;7 省 略 部 分 内 容 


insn 3 的 处 理 也 是 类 似 ， 其 中 的 虚拟 寄存 器 (reg/f: SI 54 virtual-stack-vars) 被 实例 化 成 物理 寄存 器 (reg/f: SI 20 гате) ， 即 frame 寡 存 器 ， 另 外 ， 该 insn 的 insn_code=CODE_FOR_movsi 1, 
在 gcc/config/i386/i386.md 文 件 中 也 可 以 找到 相应 的 指令 模板 定义 。 























还 需要 说 明 的 是 ， 所 谓 的 arg、frame 等 物理 寄存 器 在 给 定 的 目标 机 器 上 并 不 一 定 都 是 存在 的 ， 因 此 ， 在 后 续 的 寄存 器 分 配 过 程 中 ， 可 以 使 用 寄存 器 消除 的 方法 ， 将 这 些 寄 存 器 替换 成 真正 存在 的 物理 寄 
存 器 。 









































关于 上 述 几 个 特殊 虚拟 寄存 器 的 意义 及 其 与 一 些 物理 寄存 器 的 关系 ， 可 以 参见 图 9-6 中 的 内 容 。 











113 ”指令 调度 








GCC 中 的 指令 调度 (Instruction Scheduling) 就 是 对 当前 函数 中 的 insn 序 列 进行 重新 排序 ， 从 而 更 充分 地 利用 目标 机 器 的 硬件 资源 ， 提 高 指令 执行 的 效率 。 指 令 调度 主要 考虑 的 因素 包括 数据 相关 
(Data Dependency) 、 控 制 相关 (Control Dependency) 、 结 构 相 关 (Structural Harzard) 、 指 令 延 迟 (Delay) 或 者 指令 代价 (Cost) 等 ， 通 常 指令 调度 与 目标 机 器 中 的 流水 线 设 置 紧 密 相关 。 

















1 数据 相关 








数据 相关 是 指 指令 之 间 由 于 操作 数 的 使 用 而 引入 的 一 些 相 关 关 系 ， 这 种 关系 决定 了 指令 之 间 的 执行 顺序 。 数 据 相关 主要 包括 以 下 几 种 形式 : 

















(1) 真相 关 (True Dependenc) : 指令 S2 和 指令 S1 真 相关 表示 指令 S1 在 52 之 前 执行 ， 并 且 S2 需 要 使 用 S1 的 目的 操作 数 ， 通 常 也 称 为 写 后 读 (RAW, Read After Write) ， 例 如 : 

















10 
хжтс 





可 以 看 出 ，S2 的 源 操作 数 x 是 S1 的 目的 操作 数 ， 此 时 称 S2 与 S1 真 相关 。 











(2) 反 相 关 (Anti-dependence) : 指令 S2 和 指令 S1 反 相关 表示 指令 S1 在 S2 之 前 执行 ， 并 且 S2 需 要 使 用 S1 的 源 操作 数 ， 通 常 也 称 为 读 后 写 (Write After Read, WAR) ， 例 如 : 




















此 时 ，S2 的 目的 操作 数 是 y， 同 时 y 也 是 $1 的 源 操作 数 ， 这 种 情况 下 ，S2 和 S1 反 相关 ， 且 S1 和 5S2 的 执行 顺序 不 能 改变 。 




















(3) 输出 相关 (Output Dependence) : 指令 5S2 和 指令 S1 输 出 相关 表示 指令 S1 在 S2 之 前 执行 ， 并 且 S1 和 S52 具有 相同 的 目的 操作 数 ， 通 常 也 称 为 写 后 写 (Write After Write, WAW) , 例如: 
































可 以 看 出 S1 和 S2 的 目的 操作 数 均 为 x， 两 条 指令 均 要 对 x 进行 赋值 操作 ， 此 时 S2 和 S1 输 出 相关 ， 因 此 ，S1 和 S52 指 令 的 执行 顺序 不 能 改变 。 





























(4) 输入 相关 (Input Dependence) : 指令 S2 和 指令 S1 输 入 相关 表示 指令 S1 在 5S2 之 前 执行 ， 并 且 S1 和 5S2 均 会 读 取 相同 的 操作 数 ， 通 常 也 称 为 读 后 读 (Read After Read, RAR) ， 例 如 : 




















这 里 表示 S2 和 S1 均 会 读 取 变 量 x 的 值 ， 该 相关 性 不 影响 指令 的 重新 排序 。 




















如 果 指令 S1 在 S2 之 前 执行 ， 且 指令 92 和 S1 之 间 存 在 真相 关 、 反 相关 或 者 输出 相关 的 依赖 关系 ， 为 了 保证 程序 执行 的 正确 性 ， 则 指令 91 和 指令 S2 不 能 改变 执行 顺序 。 如 果 指 令 之 间 只 有 输入 相关 ， 或 者 
不 存在 数据 相关 性 时 ， 则 可 以 对 指令 进行 重新 排序 而 不 会 影响 程序 执行 的 正确 性 。 




















2. 控 制 相关 





控制 相关 是 指 某 条 指令 的 执行 依赖 于 其 他 指令 的 执行 状态 ， 这 种 控制 相关 通常 是 有 一 些 表示 条 件 跳 转 的 指令 引起 的 ， 例 如 : 








其 中 ， 指 令 S2 与 指令 31 控制 相 关 ， 表 示 当 S1 中 的 条 件 为 false 时 才 执行 S2。 


3. 结 构 相关 








结构 相关 也 称 为 结构 冲突 ， 通 常 是 指 由 于 目标 机 器 的 硬件 资源 限制 而 导致 的 相关 性 冲突 。 目 标 机 器 中 的 硬件 资源 ， 主 要 包括 流水 线 资源 、 执 行 部 件 、 寄 存 器 、 内 存 等 都 是 有 限 的 ， 可 能 出 现 多 条 指令 访 
问 某 个 特定 资源 的 冲突 。 在 GCC 中 ， 通 常 在 机 器 描述 文件 中 使 用 define_automaton、define_cpu_uint 及 define_insn_reservation 等 RTL 语 言 来 描述 指令 对 目标 机 器 上 各 个 硬件 资源 的 占用 情况 。 这 些 信息 
在 机 器 文件 处 理 的 过 程 中 将 用 来 构造 硬件 资源 描述 的 自动 机 (Automaton) ， 并 根据 指令 对 资源 的 使 用 情况 (通常 由 define_insn_reservation 来 描述 ) 对 指令 进行 调度 ， 从 而 避免 指令 之 间 的 结构 相关 冲 


突 。 




























































































由 于 上 述 各 种 相关 性 的 存在 ， 在 GCC 进行 指令 调度 时 ， 通 常 需要 根据 指令 之 间 的 数据 相关 性 、 控 制 相关 性 和 目标 机 器 中 流水 线 等 硬件 资源 的 状态 ， 对 输入 的 指令 序列 进行 重新 排序 ， 从 而 达到 充分 利 
流水 线 等 硬件 资源 和 缩短 指令 执行 总 时 间 的 目的 。 





GCC 中 的 指令 调度 主要 包括 两 个 处 理 过 程 (Pass) ， 即 pass_sched 和 pass_sched2， 其 中 pass_sched 在 寄存 器 分 配 之 前 进行 ， 而 pass_sched2 在 寄存 器 分 配 之 后 进行 。 





114 ”统一 寄存 器 分 配 








RTL 生 成 和 处 理 过 程 中 使 用 了 大 量 的 虚拟 寄存 器 ， 这 些 虚 拟 寄存 器 在 转换 成 目标 机 器 汇编 代码 前 ， 需 要 映射 到 目标 机 器 中 的 物理 寄存 器 上 ， 该 过 程 即 为 寄存 器 分 配 (Register Allocation) 。 如 何 合理 分 
配 和 使 用 物理 寄存 器 ， 提 高 代码 质量 ， 是 GCC 中 寄存 器 分 配 的 主要 目标 。 












































ССС 4.4.0 中 使 用 的 寄存 器 分 配方 法 称 为 统一 寄存 器 分 配 (Integrated Register Allocator, IRA) 。 统 一 寄存 器 分 配 以 区 域 (Region， 通 常 指 循环 结构 ) 为 寄存 器 分 配 的 基本 单位 ， 基 于 图 染色 
(Graph Coloring) 算法 进行 寄存 器 分 配 ， 其 中 图 染色 算法 一 般 采 用 Chaitin-Briggs 算 法 。 该 寄存 器 分 配方 法 之 所 以 被 称 为 “统一 寄存 器 分 配 ”， 是 因为 在 该 方法 中 将 寄存 器 合并 (Register 
Coalescing) 、 寡 存 器 生存 范围 划分 (Register Live Range Splitting) 、 寄 存 器 优选 (Register Preference) 、 产 生 代码 等 过 程 与 寄存 器 分 配 中 的 染色 (Coloring) 过 程 整合 在 一 起 。 


















































11.5 汇编 代码 生成 








标 机 器 的 汇编 代码 ， 该 处 理 过程 由 pass final 完 成 。pass final 的 定义 如 下 : 








在 经 历 了 大 量 的 RTL 优 化 处 理 过 程 后 ，RTL 中 间 表 示 最 终 将 被 转换 成 











struct rtl оре pass pass final = ( 


11.6 


{ 
КТІ РА55, 


NULL, /* name */ 

NULL, /* gate */ 

rest of handle final, /* execute */ 

NULL, ` Е /ж aub */ 

NULL, /* next */ 

0, /* static pass number %/ 
TV_FINAL, /ж жу іа */ 

0, /% properties required %/ 
0, /% properties provided */ 
0, /% properties destroyed */ 
0 /* todo flags start */ 


, 
ТОГО ggc collect 
} 


本 节 首 先 给 出 一 般 汇 编 代 码 文件 的 结构 ， 然 后 给 出 在 RTL 生 成 汇编 代码 中 一 些 关 键 的 定义 和 相应 的 处 理 函 数 ， 最 后 结合 实例 说 明 从 RTL 生 成 


小 结 


本 章 主要 介绍 了 RTL 处 理 过 程 中 的 几 个 典型 过 程 ， 包 括 实例 化 特殊 虚拟 寄存 器 、 指 令 调度 、 寄 存 器 分 配 以 及 汇编 代码 生成 等 ， 从 中 可 以 大 致 看 到 GCC 对 于 RTL 中 间 表 示 的 一 些 基本 处 理 过 程 。 由 





RTL 的 代码 优化 过 程 非常 多 ， 难 以 在 一 本 书 中 涵盖 ， 


GCC 移植 问题 。 本 章 以 西安 邮电 大 学 自主 看 


12-1 


GCC 目前 已 经 支持 众多 的 目标 机 器 ， 是 一 种 具有 良好 移植 性 的 编译 系统 。 然 而 ， 在 实际 应 


todo flags finish */ 











标 机 器 汇编 代码 的 主要 过 程 。 




















基 
因此 ， 在 本 章 中 并 没有 涉及 这 样 些 内 容 ， 读 者 可 以 在 研读 本 章 给 出 的 RTL 处 理 过 程 的 基础 上 ， 对 自己 关心 的 RTL 优 化 过 程 ， 结 合 其 源 代码 进行 单独 分 析 。 





























第 12 章 “支持 新 的 目标 处 理 器 















































GCC 为 新 开发 的 处 理 器 实现 软件 编译 ， 需 要 面 对 一 个 新 的 话题 ， 就 是 











中 ， 新 的 处 理 器 层出不穷 , 为 了 使 


























GCC 移植 


由 于 GCC 良好 的 设计 框架 ，GCC 的 中 间 处 理 与 

















发 的 多 态 同 构 阵 列 处 理 器 (Polymorphic Array Architecture for Graphic, PAAG) 为 目标 机 器 ， 简 要 介绍 将 GCC 移植 到 新 处 理 器 的 过 程 。 























标 处 理 器 完全 独立 ， 因 此 ，GCC 移 植 到 新 的 目标 处 理 器 只 需要 对 GCC 的 后 端 进行 扩充 ， 使 之 能 够 为 新 的 目标 系统 生成 代码 。 





















































为 了 支持 良好 的 移植 特性 ，GCC 从 不 同 的 处 理 器 平台 结构 中 抽象 出 各 种 目标 机 器 共有 的 操作 属性 ， 包 括 大 量 的 宏 定 义 和 各 种 各 样机 器 描述 的 规范 ， 并 以 机 器 描述 文件 为 移植 接口 提供 给 用 户 。 GCC 提供 
的 移植 接口 文件 主要 包括 3 个 文件 ， 分 别 是 : 























(1) 语言 编写 的 机 器 描述 头 文件 ${targetj.h: 主要 包括 与 目标 机 器 相关 的 宏 定义 、 函 数 声明 等 。 














(2) C 语 言 编写 的 机 器 描述 文件 $ftarget}.c: 主要 包括 与 目标 机 器 相关 的 函数 实现 ， 这 些 函 数 可 能 会 被 GCC 或 机 器 描述 文件 gftarget}j.md 所 使 用 。 














(3) 使 用 RTL 语 言 进行 机 器 描述 的 机 器 描述 文件 $ftarget}.md: 主要 定义 了 与 目标 机 器 指令 相关 的 指令 模板 、 帘 孔 优化 、 流 水 线 实现 等 内 容 。 

















上 述 3 个 描述 文件 构成 了 一 个 目标 机 器 的 形式 化 描述 ， 定 义 了 由 GCC 抽象 机 器 到 目标 机 器 的 映射 规则 。 





总 体 来 说 ，GCC 移 植 时 ， 需 要 明确 的 描述 信息 主要 包括 : 


= 


(1) 目标 机 器 的 指令 格式 及 意义 : 这 些 信息 是 机 器 描述 文件 中 指令 模板 编写 的 依据 。 














(2) 特殊 的 目标 机 器 命令 行 选 项 : 用 来 指导 GCC 驱动 程序 使 用 合理 的 编译 选项 ， 从 而 控制 编译 器 处 理 目 标 机 器 的 特殊 编译 功能 。 
































(3) 目标 机 器 的 存储 布局 : 主要 包括 基本 数据 类 型 对 应 的 字 节 数 和 每 个 字 节 对 应 的 大 小 、 地 址 对 齐 方式 等 信息 。 















































(4) 目标 机 器 的 寄存 器 使 用 规范 : 主要 包括 寄存 器 类 型 、 寄 存 器 宽度 、 寄 存 器 使 用 限制 、 特 殊 寄存 器 的 使 用 方法 等 。 


















































(5) 堆栈 布局 : 主要 包括 栈 帧 的 布局 ， 函 数 调用 规范 (包括 函数 调用 前 后 的 堆栈 处 理 、 参 数 传递 、 参 数 访问 、 函 数 返 回 处 理 以 及 返回 值 传递 等 ) 。 












































(6) 寻 址 方式 : 目标 机 器 上 所 支持 的 寻 址 方式 及 其 使 用 规范 。 




















(7) 汇编 文件 输出 格式 : 主要 包括 目标 机 器 所 支持 的 汇编 文件 语法 ， 如 伪 操 作 、 特 殊 功 能 符号 在 汇编 文件 中 表示 的 意义 、 汇 编 文 件 中 注释 格式 等 。 

















(8) 调试 信息 的 输出 格式 及 其 他 信息 。 






































以 上 信息 在 GCC 提供 的 移植 接口 中 通常 以 宏 定义 的 方式 给 出 ， 这 些 预定 义 宏 的 总 体 数量 有 几 百 个 ， 功 能 繁杂 ， 理 解 起 来 有 一 定 的 困难 。GCC 的 移植 过 程 往往 是 复杂 而 充满 艰辛 ， 作 者 结合 自己 的 实际 经 
历 ， 提 出 以 下 几 点 建议 供 读者 参考 : 












































(1) GCC 提供 的 移植 接口 中 的 宏 定义 通常 都 有 其 默认 值 ， 对 这 些 默认 值 可 以 充分 地 利用 。 


(2) 充分 借鉴 已 成 功 移植 的 GCC 代码 ， 将 与 目标 机 器 较为 相近 的 机 器 描述 文件 作为 参考 。 




















(3) 采用 循序 渐进 的 移植 策略 ， 从 最 基本 的 描述 内 容 入 手 ， 实 现 目标 机 器 所 支持 的 基本 功能 ， 再 逐步 深入 ， 实 现 完 整 的 指令 系统 描述 ， 最 后 再 补充 完善 性 能 优化 等 方面 的 内 容 。 
































(4) 充分 利用 GCC 的 中 间 结 果 和 gdb 等 调试 工具 ， 对 移植 过 程 中 增加 和 修改 的 代码 进行 跟踪 调试 。 



































(5) 当 移 植 过 程 出 现 异 常 时 ， 需 要 仔细 检查 机 器 描述 文件 ， 确 保 机 器 描述 文件 描述 的 内 容 符 合 目标 机 器 的 各 种 规范 ， 此 时 应 该 详细 参阅 目标 处 理 器 的 用 户 手册 ， 并 积极 咨询 相应 的 硬件 工程 师 。 


12.2 ”PAAG 处 理 器 


本 节 来 介绍 一 个 新 的 PAAG 处 理 器 ， 并 以 此 为 目标 机 器 ， 在 后 续 的 章节 中 介绍 GCC 到 PAAG 的 移植 过 程 。 








PAAG 阵 列 机 系统 由 多 个 处 理 器 艇 (Cluster) 组 成 ， 每 个 簇 是 由 处 理 单元 (PE) 组 成 的 一 个 二 维 阵 列 (2D-array) ， 是 一 种 较 常见 的 阵列 结构 。 一 个 基本 艇 (Base Cluster) 是 由 16 个 处 理 单元 
РЕ (Process Element) 组 成 的 4x4 阵 列 结构 ，PAAG 阵 列 处 理 器 一 个 基本 簇 的 结构 如 图 12-1 所 示 ， 其 中 的 16 个 处 理 单元 PE00~PE33 均 是 具有 通用 计算 功能 的 处 理 单元 ， 每 个 处 理 器 单元 分 别 由 一 个 ALU、 
一 个 控制 器 、 一 个 路 由 器 、 四 个 邻接 共享 存储 、 数 据 存储 和 指令 存储 组 成 。 每 个 PE 通过 共享 存储 完成 与 相 邻 PE 之 间 的 通信 ， 也 可 以 通过 路 由 器 (Router) 完成 与 其 他 远程 PE 之 间 的 通信 。 
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121 PAAG 系 统 阵列 结构 中 基本 答 结 构 





ОТО 9 19 
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最 值得 一 提 的 是 ，PAAG 处 理 器 中 没有 寄存 器 文件 (Register File) ，ALU 直 接 从 片 内 存储 器 中 读 取 指 令 和 数 























的 通信 可 以 通过 直接 寻 址 的 邻接 共享 存储 器 完成 临近 通信 ， 也 可 以 通过 路 由 器 完成 远程 处 理 节 点 之 间 的 远程 通信 。 


123 GCC 移植 的 基本 步骤 





GCC 是 一 个 支持 多 平台 的 编译 系统 ， 具 有 很 高 的 可 移植 特性 ，GCC 从 不 同 的 处 理 器 平台 结构 中 抽象 出 处 理 器 共有 的 操作 
器 的 接口 。 在 移植 GCC 到 PAAG 平 台 时 ， 通 常 包 括 如 下 的 步骤 : 























(1) 通过 GCC 提供 的 后 端 移植 接口 
范 ， 编 写 相应 的 
该 存放 在 $ (GCC_SOURCE) /gcc/config/paag 目 录 下 。 





加 入 新 处 理 的 机 器 描述 文件 。 在 这 个 过 程 中 ， 需 要 仔细 分 析 PAAG 处 理 器 硬件 特性 ， 




















(2) 在 GCC 的 编译 配置 文件 中 增加 PAAG 处 理 器 的 注册 信息 。 








整个 移植 过 程 中 





要 涉及 的 文件 及 其 功能 如 表 12-3 所 示 。 





表 12-3 PAAG 移 植 时 主要 涉及 的 文件 列表 


居 ， 避 免 了 数 


硬件 描述 (Machine Description) 文件 ( 即 paag.md 文 件 ) ， 完 整 描述 PAAG 的 指令 系统 ， 同 时 ,编写 paag.c 和 paag.h 文 件 ， 定 义 目 标 文件 的 各 种 


居 在 寄存 器 和 内 存 之 间 的 频繁 移动 ， 从 而 提高 计算 效率 并 降低 功 耗 。 节 点 之 间 














属性 ， 并 将 这 些 共 有 的 操作 属性 通过 机 器 描述 的 方式 提供 给 











户 ， 作 为 移植 新 处 











提取 移植 工作 所 需 的 PAAG 系 统 的 特征 信息 ， 定 义 编译 器 对 硬件 资源 的 使 用 规 


属性 和 实现 细节 。 通 常 机 器 描述 文件 应 














其 主要 包括 两 个 文件 : $ (GCC_SOURCE) /config.sub 和 $ (GCC_SOURCE) /gcc/config.gcc。 


类 型 文件 名 称 її В 


机 器 描述 :定义 指令 模板 、 优 化 信息 机 器 描述 文件 
机 器 描述 文件 | 目标 机 器 相关 的 宏 定义 h 文件 

目标 机 器 相关 的 函数 实现 等 c 文 件 
注册 文件 设置 与 目标 机 器 相关 的 机 器 描述 文件 


$(GCC_ SOURCE)/gcc/config.gcc 





12.4 ”PAAG 机 器 描述 文件 (раад.та) 
































在 $fGCC_SOURCE}/gcc/config 目 录 下 新 建文 件 夹 paag， 并 在 paag 目 录 下 新 建 paag.md、paag.c 和 paag.h 文 件 。 其 中 ，paag.h 文 件 包 含 G6CC 需 要 用 户 提 供 的 PAAG 后 端的 基本 宏 定 义 ，paag.md 文 
件 主要 定义 PAAG 指 令 模板 ，paag.c 文 件 包含 paag.h 和 paag.md 中 需要 用 到 的 C 代 码 。 


















































paag.md 文 件 主要 根据 PAAG 指 令 系统 的 具体 规范 ， 并 按照 GCC 中 机 器 描述 文件 的 书写 规则 ， 使 用 RTL 语 言 对 PAAG 指 令 进 行 机 器 描述 。 其 主要 内 容 如 下 : 











[GCC@localhost раад-асс15 сас gcc/config/paag/paag.md 
;; Attributes 
77 定义 属性 mode 
(define attr "mode 
т 定义 属性 type 
(define attr "type" 

"move, unary, binary, compare, shift,mult, div, arith, logical,uncond branch,branch,call, call no delay slot,nop" 

(сопзі string "binary")) Е “07 ч 
;; 定义 mode 枚 举 器 MOV_MODE、CMP MODE 及 D MODE 
(define mode iterator МОУ МОРЕ [SI SF 011) 
(define mode iterator СМР МОРЕ [SI SF]) 
(define mode iterator D MODE [SI SF]) 
ji 定义 mode 枚 举 器 的 属性 值 
(define mode attr sof [(SI "МОУ") (SF "МОУЕ") (QI "SETB")]) 
7 7 数据 移动 指令 
77 立即 数 移动 MOVI 指 令 模板 
(define insn "movi" 

[(set (match operand:SI 0 "nonimmediate орегапа" "") 

(match орегапа:51 1 "immediate орегапа" ""))] 

"ТА 50, #%1" 

[(set attr "type" "arith") 

(вес attr "mode" "SI")]) 

2: MOV、MOVF、SETB 指 令 模 板 
(define insn "mov<mode>" 

[(set “(match орегапа:МОУ MODE 0 "general operand" "") 

(match operand:MOV MODE 1 "general operand" ""))] 

"<sof> 50, %1" 

[(set attr "type" "arith") 

(вес attr "mode" "<MODE>")]) 

77 算术 运算 指令 
j; 定义 code 枚 举 器 
(define code iterator arith ор [Plus minus mult div]) 


unknown, попе, QI,HI, SI,SF" (const_string “unknown")) 


(define соде attr ор пате [(plus "add") (minus "sub") (mult "mul") (div "div")]) 
(define code attr іпѕп пате [ (Plus "Арр") (minus "SUB") (mult "MULT") (div "DIV")]) 
(define соде attr op_type [ (plus "arith") (minus "arith") (mult "mult") (div "div")]) 
(define mode attr dm [(SI "") (SF "Е")]) 


;; ADD, SUB, MULT, DIV, ADDF, SUBF, MULTF, DIVF}4 44 
(define_insn "<op_name><mode>3" 
[(set (match operand:D MODE 0 "general_operand" "") 
(arith op:D MODE (match operand:D MODE 1 "general operand" "") 
(match operand:D MODE 2 "general_operand" "")))] 
"<insn name><dm> %0, %1, %2" 
[(set attr "type" "<op type>") 
(вес attr "mode" "<МОрЕ>")]) 
ii 布尔 操作 指令 
(define code iterator Боо1 ор (апа ior хог]) 
(define code attr bool пате [ (апа "апа") (ior "іог") (хок "хог")]) 
(define code attr bool insn name [(and "AND") (ior "OR") (хог "XOR")]) 
2; RND、OR、XOR 指 令 模板 
(define іпѕп "<роо1 паше>в13" 
(вес (match орегапа:51 0 "general орегапа" "") 
(bool op:SI (match operand:SI 1 "general operand" "") 
(match operand:SI 2 "general орегапа" "")))] 


"<роо1 іпѕп name> %0, %1, %2" 
(set_attr "type" "logical") 

(set_attr "mode" "SI")]) 
2: NOT 指 令 模板 
(define insn "опе cmplsi2" 
(вес (match operand:SI 0 "general орегапа" "") 

(not:SI (match operand:SI 1 "general орегапа" "") ))] 
"МОТ %0, %1" 
(вес attr "type" "Іодіса1") 

(вес attr "mode" "51")]) 
ii 移 位 指令 
(define code iterator shift ор [ashift ashiftrt]) 
(define code attr shift пате [(ashift "ashl") (ashiftrt "ashr")]) 
(define code attr shift insn name [(ashift "SLL") (ashiftrt "SRL")]) 
i; SLLIT、SRLI 指 令 模板 ， 移 动 位 数 由 立即 数 给 出 
(define insn "<shift пате>іѕі3" 
(вес (match operand:SI 0 "general орегапа" "") 

(shift op:SI (match operand:SI 1 "general operand" "") 

(match орегапа:51 2 "immediate орегапа" "")))] 





"<shift insn пате>І %0, 91, #%2" 
(век attr "type" "shift") 
(set attr "mode" "SI")]) 
j; SLL、SRL 指 令 模 板 
(define insn "<shift name>si3" 
(set (match operand:SI 0 "general орегапа" "") 
(shift op:SI (match operand:SI 1 "general operand" "") 
(match operand:SI 2 "general operand" "")))] 


"<shift insn name> %0, %1, %2" 
(вес attr "type" "shift") 
(век attr "mode" "SI")]) 
и 比较 指令 
(define expand "cmp<mode>" 
(set (reg:CC 61) 
(сотраге:СС (match operand:CMP MODE 0 "register орегапа" "") 
(match operand:CMP MODE 1 "register_operand" "")))] 





1 
раад сотраге ор0 
раад сошраге орі 
ГОМЕ; 
гу 
(define code iterator апу сопа (ед пе gt lt де 1е]) 
(define ехрапа "b<code>" ” 
І (вес (рс) 
(if then else (апу сопа (match дир 1) (const i 
(label ref (match operand 0 "" 
(рс)))] 


орегапаѕ [0]; 
орегапаѕ [1]; 





operands [1] = деп compare гед (<CODE>, раад compare ор0, раад сопраге 0р1); 
ку 
(define expand "b<code>f" 
[(set (pc) 
(if then else (any cond (match dup 1) (const int 0)) 
(label ref (match орегапа 0 "" "")) 
(рс)))] 
"( орегапаѕ [1] = деп сопраге гед (<CODE>, paag сопраге ор0, paag сопраге ор1);}") 
2; Now match both normal апа inverted jump. 
(define_insn "cbranchsi4" 
[(set (рс) (if then else (match operator:SI 0 "comparison_operator" 
[ (match_operand:SI 1 "nonimmediate орегапа" "") 
(match operand:SI 2 "nonimmediate operand" "") 1) 
(label ref (match орегапа 3 "" "")) 
(рс)))1 
1 
char str[15],str1[40]; 
sprintf (str, "3s", rtx_name [СЕТ CODE (operands [0]) 1); 
sprintf (str1,"%s %%1, %%2, %%13", str); 
switch (GET_CODE (operands [0] ) ) 
{ 
case EQ: return "BEQ 81, %2, 813"; 
сазе МЕ: return "BNE $l, %2, 313"; 
case LT: return "BLT %1, %2, 313"; 
case LE: return "BLE Sl, %2, %13"; 
case GT: return "BGT 81, 52, 813"; 
case СЕ: return "BGE %1, %2, %13"; 
default: return strl; 
} 
} 
[(set attr "type" "compare") 
(вес attr "mode" "51")]) 
(define insn "cbranchsf4" 
[(set (рс) (if then else (match operator:SF 0 "comparison operator™ 
[(match operand:SF 1 "nonimmediate орегапа" "") 
(match operand:SF 2 "nonimmediate орегапа" "") 1) 
(label ref (match орегапа 3 "" "")) 
(ро))) 1 
1 
char str[15],str1[40]; 
sprintf (str,"%s", rtx папе [СЕТ СОРЕ (орегапаѕ [01) 1); 
sprintf (strl; "$s %%1, %%2, %%13",51ү); 
switch (СЕТ СОГЕ (operands [0])) 
1 


case ЕО: return "EQF $1, %2, 813"; 
case МЕ: return "NEF %1, 32, 813"; 
case LT: return "LTF %1, %2, 313"; 
case LE: return "LEF %1, %2, 313"; 
case СТ: return "GTF %1; %2, 813"; 
case СЕ: return "СЕК %1, %2, 513"; 


default: return strl; 
} 
} 
[(set attr "гуре" "compare") 
(вес attr "mode" "5Е")]) 

77 无 条 件 跳 转 JUMP 指 令 模板 
(define insn "jump" 

І(вес (рс) (label ref (match operand 0 "" "")))] 


"JMP 810" 


) 
рр 间接 跳 转 J 指 令 模板 
(define insn "іпдігесе jump" 
[ (set (рс) (match орегапа:51 0 "address орегапа" "р"))] 


"J вай" 


) 
77 函数 调用 指令 
(define insn "са11 value" 
[(set (match operand:SI 0 "general operand" "") 
(call (match operand:SI 1 "general operand" "") 
(match орегапа:51 2 "general орегапа" ""))) 





] 

"CALL У %1" ;;"%0=CALL %1 with %с2 number of parameters" 
) 
77 operands[1] is stack size гіх 
77 operands[2] is next_arg_register 
(define_insn "call" 

[ (parallel [(са11 (match_operand:SI 0 "call_operand" "") 

(match_operand:SI 1 "" "")) 
(clobber (reg:SI 31))])] 

"CALL $1") 
j; RETURN 指令 模板 
(define insn "return" 

[(set (pc) (return))] 


"ВЕТ" 


) 

и 类 型 转换 指令 

(define insn "floatsisf2" 

[(set (match operand:SF 0 "general орегапа" "") 
(float:SF (match орегапа:51 1 "general орегапа" "")))] 

"СУТІ2Е %0, %1" 

) 

(define insn "fix truncsfsi2" 

[(set (match operand:SI 0 "general operand" "") 
(fix:SI (match operand:SF 1 "general орегапа" 





"СУТЕ2І %0, %1" 


) 
77 空 指令 NOP 指 令 模板 
(define іпѕп "пор" 
І(сопвЕ int 0)1 


2: 虚拟 测试 指令 
(define insn "dummy pattern" 
[ (reg:SI 0)1 





"This is just empty !" 
) 





12.5 ”paag.[ch] 文 件 

















在 编写 paag.[ch] 文 件 的 过 程 中 ， 需 要 对 目标 机 器 有 较 全 面 的 理解 ， 包 括 寄存 器 、 存 储 布局 、 函 数 调用 中 参数 传 入 、 传 出 的 方式 、 堆 栈 的 组 织 等 关键 问题 ， 同 时 可 以 广泛 参考 其 他 较为 相似 的 机 器 描述 文 
件 中 相关 部 分 的 实现 。 













































































首先 给 出 paag.h 中 的 关键 内 容 。paag.h 主 要 对 GCC 提供 的 目标 机 器 接口 中 的 宏 定义 进行 重新 定义 ， 包 括 存储 布局 、 寡 存 器 使 用 规范 、 堆 栈 即 函数 调用 规范 、 寻 址 方式 、 汇 编 输出 格式 等 内 容 (参见 第 9 
章 的 描述 ) 。 


12.6 ”PAAG 后 端 注册 


在 GCC 中 添加 新 的 处 理 器 支持 后 ， 要 在 GCC 中 注册 新 添加 该 处 理 器 的 支持 信息 ， 主 要 包括 以 下 配置 文件 的 修改 : 











(1) 修改 $ (GCC_SOURCE) /config.sub 文 件 ， 用 来 描述 CPU 类 型 和 公司 信息 (CPU-COMPANY) 等 。 














[СССё1оса1һоѕі paag-gcc]$ diff config.sub config.bak 


1204c1204 

< ii 

> ii 

1208, 1215d1207 

< paag*) 

< basic machine=paag-xupt 
< ii 

< 





(2) 修改 $ (GCC_SOURCE) /gcc/config.gcc 文 件 。 





[GCC@localhost paag-gcc]$ diff gcc/config.gcc gcc/config.gcc.bak 
370,3764369 

< раад*-*-*) 

< cpu type=paag 

© іе 

ж 

2417,243542409 

< paag-*-*linux*) 


use_collect2=no 


< tm file="${tm Ё11е}" 

< tmp file="${tm p file}" 
< out file="paag/paag.c" 
< md file="paag/paag.md" 

< gas=no 

< апи 1а=по 

< 

< 

< 











将 新 加 入 的 平台 PAAG 加 入 到 GCC 中 。 第 一 个 的 paag-*-*linux* 表 示 新 加 入 的 平台 PAAG ， 第 二 个 通配符 * 表 示 CPU 三 商 ， 第 三 个 通配符 * 表 示 PAAG 生 成 汇编 指令 的 类 型 。 


127 ”GCC 移植 测试 




















GCC 的 移植 不 可 能 是 一 跳 而 就 的 ， 需 要 针对 目标 处 理 器 ， 使 用 大 量 的 测试 程序 进行 测试 ， 对 于 生成 的 汇编 代码 也 可 以 进行 各 种 性 能 分 析 ， 在 保证 正确 性 的 基础 上 进行 优化 ， 提 高 执行 效率 。 





下 面 通 过 例 12-1， 说 明 以 PAAG 为 目标 处 理 器 的 GCC 移植 结果 ， 并 对 其 生成 的 汇编 代码 进行 详细 解释 。 


例 12-1 GCC 移植 实例 测试 


[GCC@localhost 1га]$ cat func са11.с 
int f(int a, int b, int c, іпЕ d, int e){ 
return а+р+с+а+е; 
} 
int main(int agrc, char *argv[]){ 
int ізі, 3-2, sum=2; 
again: 
sum = Ғ(вшп,),1,),4); 
if (sum<100) goto again; 
return sum; 


i 











使 用 移植 的 GCC 对 上 述 代码 进行 编译 ， 生 成 如 下 的 汇编 代码 。 











[GCC@localhost 1га]$ ~/paag-gcc/host-i686-pc-linux-gnu/gcc/ccl -fdump-rtl-all func са11.с -fverbose-asm -fdump-tree-all 
[GCC@localhost 1га]$ сас func call.s 

j; СМО С (ССС) version 4.4.0 (paag-xupt-linux) 

р compiled Бу GNU С version 4.4.7 20120313 (Кеа Hat 4.4.7-11), СМР version 4.3.1, MPFR version 2.4.1. 

¿section .text 

.p2align 2 

.global ғ 

i BAEHR 


; 函数 的 开始 部 分 , 主要 完成 上 层 SFrame 寄 存 器 的 保 在， 保存 函 数 中 可 能 破坏 的 寄存 器 。 


; 函数 王 没有 调用 其 他 函数 ， 所 以 传 出 参数 空间 大 小 为 0。 
7 函数 下 中 没有 局 部 变量 ， 但 需要 为 从 寄存 器 传 入 的 参数 在 局 部 变量 分 配 空间 ， 其 中 有 三 个 参数 使 用 寄存 器 传递 ， 所 以 分 配 空间 为 12 个 字 节 。 


2; prologue 

PUSH $frame 

PUSH $RO 

MOV $frame, $sp 77 设置 当前 栈 帧 的 $frame 值 

SUB бар, бер, 12 17 调整 $sp 的 值 ， 为 局 部 变量 和 传 出 参数 分 配 空间 。 


;; Епа prologue 
и 将 参数 从 参数 寄存 器 Sarg0~Sarg2 复 制 到 局 部 变量 区 域 
;; basic block 2 


MOV -4 ($Ғгапе), Sarg0 ра, а 
MOV -8 ($frame), $argl rib 
MOV -12 ($Ғгате), $arg2 е сус 
ii 执行 atb+cy 结果 保存 在 SRO 中 
ADD SR0， -4 ($Ғгате), -8 ($frame) ; 0.1196, а, Б 
ADD SR0， $RO, -12 ($frame) 2; 0.1197, D.1196,; с 


;; 从 堆栈 的 参数 区 域 获取 参数 d 和 参数 e， 并 执行 累加 。 
7 7 从 d 和 e 的 地 址 信息 可 以 看 出 ， 参 数 d 和 e 通 过 堆栈 进行 传递 。 
ADD 580, 550, багар 2; 2.1198, р.1197, А 


2; 0.1195, р.1198, е 


;; 调整 Ssp 的 值 ， 释 放 局 部 变量 和 传 出 参数 空间 
;; 恢复 上 层 $frame 寄 存 器 的 值 


ADD $RO, $RO, 4 (Захар) 
г: 将 返回 值 保存 在 寄存 器 SRO 中 

MOV $ret, $RO рр, <result> 
и 函数 的 结束 部 分 ， 释 放 传 出 参数 和 局 部 变量 区 域 

‚; epilogue 

ADDI $sp, $sp, 12 

POP $RO и 恢复 保存 的 寄存 器 

POP $frame 

RET ;; 返回 指令 


% Епа epilogue 
77 函数 main 的 代码 





.p2align 2 
:global main 
main: 
ii main 函 数 的 开始 部 分 ,主要 完成 上 层 Sframe 寄 存 器 的 保存 ,保存 函数 中 可 能 破坏 的 寄存 器 。 
м main 函 数 会 调用 函数 f，f 函 数 共有 5 个 参数 ， 其 中 3 个 使 用 寄存 器 传道， 两 个 使 用 堆栈 空间 传 出 ， 所 以 传 出 参数 的 空间 大 小 为 8 个 字 节 。 
м in 函数 中 会 破坏 SR0 的 内 容 ， 因 此 需要 在 进入 函数 main 时 ， 需 要 在 堆栈 中 保存 SRO 的 值 ， 所 以 堆栈 中 保存 寄存 器 的 空 间 大 小 为 4 个 字 节 。 
ii main 函 数 中 有 5 个 局 部 变量 ， 共 需要 为 其 分 配 20 个 字 节 ， 局 部 变量 区 域 还 需要 为 从 寄存 器 待 入 的 参数 argc 和 argv 分 配 空间 ， 即 8 个 字 节 ， 所 以 局 部 变量 
77 当前 函 数 栈 帧 最 底部 存储 了 main 的 返回 地 址 和 上 层 函 数 的 SErame， 共 占 用 8 个 字 节 。 
і main 函数 栈 帧 的 总 大 小 为 48 个 字 节 ， 其 中 : 传 出 参数 区 域 大 小 为 8 个 字 节 ， 局 部 变量 区 域 大 小 为 28 个 字 节 ， 保 存 寄存 器 区 域 为 4 个 字 节 ， 


; prologue 保存 函数 调用 现场 





空间 总 的 大 小 为 28 个 字 节 


保存 返回 地 址 和 $frame 占 用 8 个 字 节 。 




















GNU Project[OL].https://gnu.org/. 


Vim the Editor[OL].http://www.vim.org/. 
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PUSH $frame 
PUSH SRO 
MOV $frame, $sp 
SUB бар, бер, 36 
2; Епа prologue 
22 main 函数 代码 部 分 
;; basic block 2 
MOV -24 ($frame), Sarg0 ;; agrc, адтс > 保存 参数 argc 到 堆栈 的 局 部 
MOV -28 ($Ғгате), Ѕага1 ;; argv, argv ;; 保存 参数 argv 到 堆栈 的 局 部 
IA -20 ($frame), #1 #1, тісі 
ТА -16 ($frame), #2 ЕА ко) Шал 
ТА -12 ($frame), #3 Е к= 3 
ТА -8 ($frame), #4 і т, ;; ш=4 
ІА -4 ($frame), #2 ;; sum, ;; Бип = 2 
ЈМР 14 ii 
17: 
2; basic block 5 
пор 
14: 
; basic block 3 
MOV бар, -16 ($frame) 
А ялан ки), ЖОЛЫН ЕН ЖАШСЫН ' 
MOV 4($sp), -20 ($frame) иі 
алғанан Жа, {Ж Л] җнр ААА 
MOV $arg0, -4 ($frame) 24, Sum 
ГҮ ялга җн 参数 Sum， 使 用 寄存 器 Sarg0 传 递 
MOV $argl, -8 ($frame) irm 
;; АЛЕКЕ Н Жап, AFAR Фагот ič 
MOV $arg2, -12 ($frame) ii К 
и шыла 使 用 寄存 器 $arg2 传 递 
CALL м 1; 执行 函数 调用 
MOV ко, $ret j; sum.0, 
;; 从 $ret 获取 函数 的 返回 值 
MOV -4 ($frame), SR0 š; sum, sum.0 
А 5к0, #99 77 tmp40, 
BLE -4 (5Ғгаше), $RO, L7 2; sum, tmp40, 
L5: 
;; basic block 4 
MOV SR0， -4 ($Ғгапе) 2; 0.1212, sum 
MOV $ret, SRO ;;, <result> 
;; epilogue 恢复 函数 调用 现场 
ADDI бер, $5р, 36 
РОР 550 
РОР $frame 
RET 
77 Епа epilogue 
.ident "GCC: (GNU) 4.4.0" 
12.8 小 结 
在 将 GCC 移 植 到 一 个 新 平台 时 ， 需 要 按照 6CC 提 供 的 移植 接口 ， 根 据 目标 处 理 器 的 指令 系统 以 及 存储 布局 、 遂 数 调用 规范 等 应 用 二 进 制 接口 等 规范 ,编写 $ftarget}.md、${target}.h 和 $f{target}.c 
文件 。 在 移植 过 程 中 ， 应 该 逐步 深入 ， 借 鉴 已 有 的 成 功 范 例 ， 合 理 使 用 调试 工具 ， 并 与 硬件 工程 师 积极 配合 。 
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